머니투데이

머니투데이 페이스북 머니투데이 트위터
통합검색

오늘의 증시

오늘의 증시
코스피 코스닥 원/달러
2270.06 787.15 1118.40
보합 22.18 보합 17.37 ▼4.7
+0.99% +2.26% -0.42%
MT 핫이슈 배너 MT 금융페스티벌 메디슈머시대 (7/6~미정)
블록체인 가상화폐

[단독]시(詩) 쓰는 AI…“인간부터 첫 구절 읊어보시게”

포스텍 정보통신연구소 조형배·서찬양 연구원 개발…“국어는 AI도 어려워”

머니투데이 포항=류준영 기자 |입력 : 2018.06.07 03:01
폰트크기
기사공유
AI아트랩이 쓴 시/자료=포스텍
AI아트랩이 쓴 시/자료=포스텍
MT단독
A: “그대 나만 믿고 따라오지 않겠는가.”
B: “그대의 젊은 아름다운 길을.”
A: “항상 함께였던 너와 나.”
B: “너는 나를 보냈다. 내 마음은 그 속에서”

시(詩)를 한 구절씩 나누는 A, B는 연인 사이일까? 아니다. A는 인간, B는 인공지능(AI)이다. 국내 처음으로 ‘시 쓰는 AI’가 등장했다. 포스텍(옛 포항공대) 정보통신연구소 조형배·서찬양 연구원이 공동개발한 ‘AI 아트랩(연구 프로젝트명)’이 주인공이다.

이 AI 프로그램은 사람이 첫 구절을 임의로 입력하면 그에 어울릴 만한 5개 구절을 선택형 보기로 제시한다. 이 중 하나를 택하면 그와 관련된 감성적인 5개 구절을 또 제시한다. 이런 식으로 한편의 새로운 창작시를 완성해 간다.

연구진은 AI아트랩에게 시 작성법을 가르치기 위해 한국어 시 10만5399행을 읽게 했다. 아예 말뭉치를 학습해 문장을 대화처럼 이어갈 수 있도록 챗봇용 문장 학습 모델 ‘시퀀스투시퀀스’(Sequence to Sequence)도 적용했다.

서찬양 연구원은 “사용자가 입력값(첫 구절)을 줬을 때 AI가 너무 엉뚱한 다음 행을 제시하면 시를 써 가는 흐름이 깨질 수 있다고 생각해 사람이 던진 구절에 상응할 수 있는 다음 행을 제시하도록 하는데 중점을 뒀다”고 말했다.

AI아트랩은 이미 학습된 시 구절 데이터를 그대로 가져다 쓰는 일이 없다. 조형배
연구원은 “기존에 학습한 시 문장을 그대로 모방하는 일은 없다”며 “만약 ‘그대의’라는 단어를 주면 그 다음에 가장 자연스럽게 연결될 만한 ‘사랑은’, ‘타오르는’ 등의 단어를 ‘확률 기반 모델’ 분석을 통해 제시한다”고 설명했다.

AI아트랩이 만든 시는 저작권을 인정받을 수 있을까. 연구진은 “시인들도 기존에 있는 시를 보고 공부하듯, AI아트랩도 10만행의 시를 읽고 배웠으며, 학습한 데이터에 없는 창작시를 완성한다”며 “하지만 이와 관련한 판례가 없어 저작권을 주장하기도 힘들다”고 말했다. 다만, 작품의 저작권은 없다 해도 소유권은 주장할 수 있을 것이라는 귀띔이다.
(사진 왼쪽부터)포스텍 정보통신연구소 조형배, 서찬양 연구원/사진=포스텍
(사진 왼쪽부터)포스텍 정보통신연구소 조형배, 서찬양 연구원/사진=포스텍

연구진이 꼽은 AI아트랩의 단점은 비교적 최근의 ‘현대 시’에 약하다는 것. 조 연구원은 “학습한 데이터가 대부분 저항의식이 짙게 깔린 계몽시, 민족주의 시 등 근대 시 위주여서 시각적 이미지와 개성을 강조한 현대 시를 구현하지는 못한다”고 말했다.

개발 과정에선 한국어를 학습시키는개 난제였다는 설명이다. AI아트랩은 이를테면 뜨거운 국물을 먹으면서도 “와~시원한다”라고 말하는 표현을 이해하지 못했다. 조사 ‘은’과 ‘는’ 역시 구분하지 못했다. 서 연구원은 “영어는 알파벳의 간단한 조합인 데다 띄워 쓰기만으로도 구분할 수 있지만, 한글은 음절, 글씨 단위 요소가 1만개가 넘고 변형도 많아 형태소로 나눠 상황에 맞는 뜻을 몇 날 며칠간 일일이 알려줘야 했다”며 “외국인과 마찬가지로 AI도 한국어를 매우 어려워했다”고 말했다.

연구진은 “AI아트랩은 시를 통한 즐거움 등 갖가지 영감을 안겨준다”며 “인간의 메마른 정서를 순화해 주는 역할을 할 것”이라고 강조했다.

류준영
류준영 joon@mt.co.kr twitter facebook

※미래부 ICT·과학 담당

이 기자의 다른기사 보기 >
  • 0%
  • 0%


오늘의 주요뉴스




베스트클릭

실시간 급상승

10.0초

5분간 수집된 조회수 기준

오늘의 운세

많이 본 뉴스