머니투데이

통합검색

머니투데이

[인공지능과 딥러닝⑨-4] 앞선 음성인식 기술, 영상으로 확장

  • 페이스북
  • 트위터
  • 네이버블로그
  • 카카오스토리
  • 텔레그램
  • 문자

[인공지능과 딥러닝⑨-4] 앞선 음성인식 기술, 영상으로 확장

머니투데이
  • 테크엠 편집부
  • VIEW : 5,951
  • 2015.03.29 06:00
  • 페이스북
  • 트위터
  • 네이버블로그
  • 카카오스토리
  • 텔레그램
  • 문자
  • 글자크기조절
  • 댓글···

국내 AI 대표주자들·다음카카오

image
다음카카오의 모바일 음성검색과 ‘바로이거’ 서비스
최근 IT서비스는 기존에는 각기 따로 존재하던 서비스가 융합되는 추세다. 예를 들어 애플의 ‘시리’는 음성인식과 자연어 처리기술, 음성합성기술이 융합된 결과다. 몇 년 전까지만 해도 어려웠던 일들이 하드웨어의 발전, 빅데이터의 활용, 머신러닝 알고리즘의 정교화 등으로 가능해졌기 때문이다.

다음카카오도 음성처리파트, 멀티미디어처리파트, 검색품질파트, 자연어처리파트, 응용분석파트 등에서 머신러닝 연구·활용을 위해 노력하고 있다. 최근에는 머신러닝 기술 등을 활용해 여러 분야를 통합한 새로운 서비스도 점차 늘려가고 있다. 지난해와 올해 선보인 즉답 검색 ‘바로이거’와 여행지 추천 서비스 ‘추천 가볼만한 곳’이 검색 서비스에 머신러닝을 적용해 수작업을 줄이고, 서비스 품질을 높인 대표 사례다.

바로이거 서비스는 온라인 정보를 자동 분석해 사용자의 질문에 답을 하는 검색 서비스다. 예를 들어 일반적인 검색 서비스는 ‘사람 갈비뼈 개수’ 로 검색하면 사람 갈비뼈 개수에 관한 내용이 있는 웹문서나 블로그 등을 검색해 보여준다. 사용자는 검색된 웹문서나 블로그 내용을 보고 사람 갈비뼈 개수를 직접 확인해야 한다.

하지만 바로이거 서비스는 검색된 웹문서나 블로그의 내용을 분석해 사람 갈비뼈 개수가 ‘12쌍, 24개’ 라는 답을 보여준다. 컴퓨터가 머신러닝 기술을 이용해 사람 대신 웹문서나 블로그 내용을 확인하고 답을 알려주는 것이다.

추천 가볼만한 곳 서비스는 여행 정보를 찾는 사용자들에게 여행지 검색결과를 먼저 보여주는 추천 서비스다. 보통 사용자들은 여행 정보를 얻기 위해 여러 사이트를 방문해 여행지에 관한 정보를 확인해야 한다. 추천 가볼만한 곳 서비스는 바로이거 서비스와 마찬가지로 온라인 정보를 자동 분석해 사용자의 수고를 줄여준다. 예를 들어 ‘유럽 여행지’ , ‘태국 여행지’ , ‘제주도 여행지’로 검색하면 각 지역의 주요 여행지를 정리해서 보여준다. 또 ‘1월 여행지’, ‘설 연휴 여행지’, ‘커플 여행지’ 등의 테마에 맞춘 여행 검색도 가능하다.

머신러닝 기술 이용, 검색 편의 높여
이외에도 머신러닝 기법은 여러 검색 서비스에서 서비스 품질을 높이기 위해 사용되고 있다. ‘쇼핑하우’ 서비스에서는 상품 썸네일을 분석해 이미지 품질에 따라 쇼핑 검색 결과에서 노출되는 우선순위를 조정한다. 또 이미지 검색에서는 이미지 내 요소들의 위치와 종류를 분석해 검색 의도에 적합한 이미지를 상단 배치하는 데 머신러닝을 사용 중이다. 머신러닝을 이용한 이미지 분류기술은 서비스 품질을 높이고 수작업을 자동화로 대체하는 데 많은 도움이 된다.

이외에도 크롤링된 문서에서 광고를 제외하고 콘텐츠가 있는 본문 영역만 색인될 수 있도록 분류할 때나 데이터 정제작업을 자동으로 진행하고, 스팸 및 성인 게시물을 필터링하는 등 다양한 영역에서 머신러닝을 적용하고 있다.

다음카카오는 한국어 음성처리 분야에 강점을 가지고 있다. 특히 음성을 듣고 형태소를 추출하는 음향 모델에 머신러닝을 활용해 인식률을 대폭 향상시켰다. 그 결과 해외 기업이 제공하는 한국어 음성인식 서비스에 비해 우수한 성능으로 자연어 패턴을 인식할 수 있게 됐다.

다음카카오의 음성처리기술은 ‘모바일 음성검색 서비스’에 집약돼 있다. 다음카카오는 2010년 한국전자통신연구원과 함께 모바일 음성검색 모듈을 개발해 처음으로 한국어가 지원되는 모바일 음성 통합검색 서비스를 출시했다. 당시까지 해외 업체에서 음성검색 서비스를 실시하고 있었지만 한국어가 지원되지 않았다.

다음카카오는 서비스 출시 이후 꾸준한 기술개발을 통해 소음 환경에서의 인식율을 높이고 자연어 음성 처리기술과 결합해 문장형 음성에 대해서도 분석과 검색이 가능하도록 했다. 특히 지난해에는 다음 지도 앱에도 음성검색기술을 추가해 음성으로 목적지까지 경로나 주변 맛집을 찾을 수 있도록 했다.

다음카카오는 음성인식 이외의 분야에서도 기술을 발전시키고, 서비스 개선을 통해 글로벌 서비스와 경쟁할 수 있도록 노력하고 있다. 특히 텍스트를 넘어 이미지, 동영상, 음악 등의 콘텐츠에서 데이터를 추출하거나 스마트폰에 장착된 마이크, 카메라, NFC 등의 입력도구를 서비스에 적극 도입하기 위해 노력하고 있다. 예를 들어 ‘농구’를 키워드로 동영상을 검색하면 지금은 영상 제목에 농구가 포함돼 있어야 검색 결과가 나타난다. 하지만 머신러닝을 이용해 동영상 콘텐츠 내용을 확인할 수 있게 되면 농구하는 장면이 있는 영상을 확인하고 영상의 내용을 텍스트로 요약해 보여주는 서비스도 가능하다.

다음카카오는 머신러닝 기법 적용을 위해 데이터마이닝, 뉴럴 네트워크, 최적화, 정보검색, 패턴인식, 자연어처리, 컴퓨터비전 등 각 조직 및 부서의 전문성에 따라 특화된 석·박사 연구 인력을 배치하고 있다.

또 머신러닝뿐 아니라 다양한 영역의 연구 및 역량 강화를 위해 회사 차원에서 해외 컨퍼런스 참관제도를 운영하고 있으며 대학 및 관련업체와의 공동연구를 통해 시너지를 꾀하고 있다.
도강호 기자


▶미래를 여는 테크 플랫폼 '테크엠' 바로가기◀
▶판매공간에서 체험공간으로 변신하는 인터랙티브 리테일 샵
▶인공지능과 딥러닝, 일자리 둘러싼 인간과 컴퓨터의 생존경쟁
▶더 좋은 세상을 꿈꾸는 13인의 청년 이노베이터
3D프린터는 요리 중, 전기를 사랑한 자전거
인공지능과 딥러닝, 빅데이터 안고 부활하다



오늘의 꿀팁

  • 띠운세
  • 별자리운세
  • 날씨
  • 내일 뭐입지

많이 본 뉴스

메디슈머 배너 (7/6~)
대한민국법무대상 (12/03~)
블록체인

포토 / 영상