머니투데이

속보
통합검색

"AI 알파고·왓슨·중력파..'십시일반' 모은 데이터 산물"

머니투데이
  • 진행=성연광 정보미디어과학부장, 정리=류준영 기자, 사진=임성균 기자
  • 2017.11.20 03:30
  • 페이스북
  • 트위터
  • 네이버
  • 카카오스토리
  • 텔레그램
  • 문자
  • 글자크기조절
  • 댓글···

전문가 좌담회-'오픈 사이언스' 현재와 미래

[편집자주] 데이터, 인류 미래를 이끌 중요한 자원으로 부상하고 있다. 데이터가 존재하지 않으면 구글의 인공지능(AI) ‘알파고’도 IBM의 ‘왓슨’도 한낱 규칙 기반의 소프트웨어(SW)에 지나지 않는다. 지난 40년간 가설로 존재한 ‘힉스입자’(우주 공간에 가득차 있는 입자)의 실체 규명, 지난 100년간 이론만으로 존재한 ‘중력파’(시공간이 뒤틀리면서 발생한 파동)의 검출, 이 같은 일이 가능했던 것은 세계 각국의 연구자들이 모든 연구 데이터를 개방·공유하는 ‘오픈 사이언스’ 덕분이었다. 힉스입자는 8000여명, 중력파는 1000여명의 과학자가 뭉쳐 만들어낸 작품인 것. 세계 과학기술계가 이처럼 거대 과학적 성과를 얻기 위해 국가차원의 데이터 관리·공유 정책을 경쟁적으로 수립·추진하고 있다. 머니투데이는 지난 13일 김재수 한국과학기술정보연구원(KISTI) 첨단정보융합본부 본부장, 고성석 건국대 산업공학과 교수, 박의규 다음소프트 이사 등을 초빙, ‘오픈 사이언스 국내외 현황과 향후 추진 전략’이란 주제로 전문가 좌담회를 진행했다.
image
(왼쪽부터 시계방향)고성석 건국대 산업공학과 교수, 성연광 정보미디어과학부장(진행), 박의규 다음소프트 이사, 김재수 한국과학기술정보연구원(KISTI) 첨단정보융합본부 본부장/사진=임성균 기자
◇오픈 사이언스와 4차 산업혁명 “떼려야 뗼 수 없는 관계”

-4차 산업혁명시대에 오픈 사이언스가 중요한 이유는

김재수 한국과학기술정보연구원(KISTI) 첨단정보융합본부장(이하 김 본부장)=R&D(연구개발) 1세대는 관찰, 2세대는 가설을 수학적인 방법을 통해 증명하는 것, 3세대는 컴퓨터 시뮬레이션과 같은 시스템을 통해 이뤄지는 거대연구라고 한다면, 4세대는 ‘데이터 인텐시브(intensive, 집중적인) R&D’다. 4세대는 데이터와 데이터 간 연결을 중요하게 여긴다. 이는 4차 산업혁명의 속성과도 같으며, 이 기반이 되는 것이 ‘오픈 사이언스’다.

오픈 사이언스는 누구나 장벽없이 학술정보를 인터넷에 접속해 읽고 쓸 수 있는 ‘오픈액세스’, 데이터 공유 및 재사용을 통한 R&D 효율화를 뜻하는 ‘오픈데이터’, 목표달성을 위해 내부와 외부 역량을 결합하는 ‘오픈 콜라보레이션’ 등을 모두 아우르는 개념이다. 이 오픈 사이언스가 4세대 R&D를 지원하는 동시에 4차 산업혁명도 지원하는 만큼 둘은 떼려야 뗄 수 없는 관계라고 할 수 있다.

건국대 산업공학과 고성석 교수/사진=임성균 기자
건국대 산업공학과 고성석 교수/사진=임성균 기자
고성석 건국대 산업공학과 교수(이하 고 교수)=4차 산업혁명 하면 대부분 AI, 3D(3차원) 프린팅, 클라우드, 스마트팩토리 등 다양한 기술과 이들을 융합하는 이야기를 많이 한다. 하지만 진정 4차 산업혁명에서 하고자 하는 이야기는 아마 기본의 중요성일 것이다. 여기서 말하는 기본은 협업과 공유다.

논문 쓸 때를 떠올려보자. 우선 자신의 생각을 다른 사람들과 공유하고 토론하면서 지식의 틀을 잡아가는 과정을 통해 완성된다. 개인이 하는 연구에는 한계가 따를 수 밖에 없다. 미래 연구로 갈수록 더하다. 따라서 연구자들 간의 긴밀한 협업이 요구되며 이를 위해 필요한 것이 오픈 사이언스다.

박의규 다음소프트 이사(이하 박 이사)=AI가 인간과 같은 수준으로 작동하기 위해선 지식화될 수 있는 대량의 데이터가 필요하다. 빅데이터, AI에 사용할 수 있는 데이터들을 어떻게 확보하느냐가 4차 산업혁명 시대를 맞은 기업·기관의 당면 과제다. 현재는 많은 데이터가 각각 개별적으로 보유되고 있다. 이러한 데이터들이 어느 한 곳에 모여 개방·공유돼야 실질적으로 4차 산업혁명에 사용될 AI들이 다양하게 만들어질 수 있다. 연구된 자료라든지 사용된 기술들이 연구자들 사이에서 공유되면, 그것을 기반으로 4차 산업혁명 시대에 맞는 새로운 연구개발 모델을 만들 수 있다. 그런 부분에서 오픈 사이언스가 맡은 역할이 크다.

◇韓 수준 저평가…“4차 산업혁명에 맞는 밑그림 그리는 중”

-국내외 오픈 사이언스 현황과 수준은.

김 본부장=올해 노벨 물리학상을 수상한 중력파 연구는 국내 과학기술계에 적잖은 파장을 몰고 왔다. 이 연구는 전기·전자 및 초정밀재료공학 등 온갖 과학기술이 집대성된 융합 연구의 성과다. 이 연구를 실행한 라이고 과학협력단은 세계 14개국 약 1000여명의 과학자가 참여했다. 이들 중에는 한국중력파 연구협력단 등 국내 과학자 14명도 있다. 우주 탄생을 이해하는 데 단서가 될 이 같은 과학적 발견은 오픈데이터를 기반으로 한 콜라보레이션(collaboration, 공동 작업)이 없었다면 성공하기 힘들었을 것이다.

한국과학기술정보연구원(KISTI) 첨단정보융합본부 김재수 본부장/사진=임성균 기자
한국과학기술정보연구원(KISTI) 첨단정보융합본부 김재수 본부장/사진=임성균 기자
KISTI는 오래전부터 많은 정보를 기관·기업에 제공해 왔다. 물리적인 정보통신망을 구축하는 사업뿐만 아니라 연구자들간 컴퓨팅·네트워크·데이터 자원을 공유 활용하는 커뮤니티 서비스도 제공해 왔다. 오픈 사이언스와 관련한 요소 기술 개발 및 지원을 예전부터 해왔다. 하지만 4차 산업혁명 시대에 맞는 종합적인 오픈 사이언스 계획이나 시나리오를 갖고 타겟팅을 한 경우는 없었다. 그런 반성을 하면서 몇 년 전부터 이런 오픈 사이언스 요소 기술을 한데 묶는 밑그림을 그려가고 있다.

고 교수=2015년에 나온 OECD(경제협력개발기구) 보고서엔 각 국가들이 추진하고 있는 오픈액세스, 오픈데이터, 오픈소스 등을 포함한 오픈 사이언스를 중심으로 한 정책, 규제, 인프라 등을 분석해놨다. 이제는 글로벌적인 아젠다인 것이다. 최근 유영민 과학기술정보통신부 장관이 연구중인 데이터까지 공유하자고 말해 주목을 받았다. 오픈 사이언스에 대한 국가의 강력한 추진 의지가 느껴진다. 하지만 현재 우리나라의 오픈 사이언스 수준은 저평가되고 있는 실정이다. 개인적인 평가는 선진국에 비교해도 크게 뒤쳐지지 않는 수준이다. 다만 아쉬운 부분은 우리만의 철학이 아직 부족하다는 것이다. 선진국이 하고 있는 정책을 따라만 하고 있다는 생각이 든다. 우리만의 오픈 사이언스 철학이 정립됐으면 하는 바람이다.

◇4P 기반 환경조성…저작권·소유권·인센티브 가이드라인 정립해야

-오픈 사이언스 환경 조성을 위해 우선적으로 할 일은

박 이사=연구 아이디어에 대한 권리를 누가 쥘 것인가다. 또 프로그램을 개발하고, 데이터를 모으고, 이를 기반으로 연구를 할 텐데 이때 권리를 같이 공유할 수 있는 환경이 마련돼야 한다. 지식을 공유·활용하는 다양한 플랫폼 중 가장 대표적인 것을 꼽으라면 ‘위키피디아’다. 어떤 주제에 대해 사람들이 자유롭게 자신이 알고 있는 바를 공유하면서 그 주제에 대한 자료가 확장되고 구체화된다. 이와 같이 오픈 사이언스도 연구나 기술을 공유할 수 있는 체계를 마련해야 한다. 지진이 발생하면 소셜미디어엔 지진 관련 글들이 쏟아진다. 우리나라 사람들은 SNS(소셜네트워크서비스)를 통해 알게 모르게 많은 데이터를 공유하고 있다. 이런 성향을 고려할 때 오픈 사이언스는 환경만 잘 갖춰진다면 앞으로 크게 활성화될 것이라고 생각한다.

다음소프트 박의규 이사/사진=임성균 기자
다음소프트 박의규 이사/사진=임성균 기자
고 교수=오픈 사이언스 활성화를 위한 환경조성은 4P(Policy, Process, Platform, Player)로 설명할 수 있다. 우선 정책(Policy)이다. 오픈 사이언스 환경에서 지적재산권에 대한 정책, 공공기금을 지원받은 연구성과 및 정보에 대한 개방 규정 등을 체계적으로 수립해야 한다. 두 번째로 프로세스(Process)다. 연구자들이 공유하고 협업하고 싶어도 어떻게 해야 하는지 잘 모르는 경우가 있다. 따라서 원활한 협업을 위한 효율적인 프로세스 설계가 중요하다. 그 다음은 플랫폼(Platform)이다. 논문을 비롯한 연구 성과물, 연구 중인 다양한 자료들을 쉽게 찾아보고 활용할 수 있는 공간, 다른 연구자들과 쉽게 협업할 수 있는 공간이 필요하다. 이 공간은 물리적으로 리포지터리(저장소)가 될 수 있다. 마지막으로 이 플랫폼을 이용하는 플레이어(Player)다. 플레이어는 연구자 뿐만이 아니라 기관, 일반인들도 포함된다. 플랫폼이 선순환 구조가 되려면 중요한 모멘텀이 필요하다. 즉, AI계 ‘알파고’처럼 오픈 사이언스에 대한 관심을 불러일으키기 위해서는 대중과 정책 입안자들에게 중요성을 인식하게 할 수 있는 스타 플레이어의 존재를 만드는 것도 중요하다.

김 본부장=정확하게 짚고 넘어갈 점이 있다. 오픈은 막연하게 내가 가진 것을 한번에 다 드러내라는 것이 아니다. 소위 말하는 엠바고가 있다. 내 데이터를 공개 하되 6개월 뒤 권리 확보가 된 후 해달라고 하든지, 내가 가진 연구성과로 비즈니스를 할 생각이니 한 2년 정도 뒤에 공개해 달라는 등의 요청이 충분히 허용된다. 당장 가진 것을 모두 공개하라는 의미가 아닌 데 그렇게 생각하는 경향들이 실제로 있다. 권리자가 내건 조건에 맞춰 오픈을 하는 것이 오픈 사이언스의 기본 정책이다. 이 같은 권리를 지켜주기 위해 저작권·소유권·인센티브 등을 모두 아우르는 가이드라인의 정립 및 법·제도 개선이 필요하다.(*이 기사는 한국언론진흥재단의 지원을 받았습니다)



베스트클릭

오늘의 꿀팁

  • 날씨
  • 내일 뭐입지

많이 본 뉴스

KB x MT 부동산 설문조사

포토 / 영상