머니투데이

속보
VIP
통합검색

100일 걸리는 특허분류, 'AI 변리사 비서'가 수일내 끝낸다

머니투데이
  • 류준영 기자
  • 카카오톡 공유하기
  • 카카오톡 나에게 전송하기
  • 페이스북
  • 트위터
  • 네이버
  • 카카오스토리
  • 텔레그램
  • 문자
  • 2021.11.24 10:18
  • 글자크기조절
  • 의견 남기기

워트인텔리전스, 세계 첫 AI 특허언어모델 '펫버트'(PAT-BERT) 개발…국내외 2100만건 특허데이터 학습

AI 모델별 데이터 크기 비교/자료=워트인텔리전스
AI 모델별 데이터 크기 비교/자료=워트인텔리전스
특허검색엔진 '키워트'를 운영 중인 워트인텔리전스가 AI(인공지능) 특허언어모델 '펫버트'(PAT-BERT)를 전세계 처음으로 개발했다고 24일 밝혔다. 이는 매년 300만건 이상 출원되는 전세계 특허 빅데이터를 빠르게 분류·검색·번역해준다. 방대한 특허자료를 일일이 찾아보고 분석해야 하는 변리사의 업무를 AI를 통해 단순화한 것이다.

윤정호 워트인텔리전스 대표는 "특허 정보를 분류할 때 대략 200여 명이 100일 간 수행할 업무를 펫버트는 수일 내에 끝낼 수 있다"며 "특허 관련 업무의 생산성·효율성을 대폭 높일 수 있는 솔루션"이라고 말했다.

윤정호 워트인텔리전스 대표/사진=워트인텔리전스
윤정호 워트인텔리전스 대표/사진=워트인텔리전스
'AI 특허언어의 신'이라고 명명된 펫버트는 구글의 범용 AI 언어모델 '버트(BERT)'를 기반으로, 총 2100만건 이상의 특허 데이터와 100억건의 특허정보를 학습시켜 개발했다.

신정훈 워트인텔리전스 CTO(최고기술책임자)는 "펫버트는 1.4테라바이트(TB)의 대용량 특허 데이터에서 중요 내용을 추출한 150기가바이트(GB)의 AI 학습용 데이터 코퍼스(Corpus)를 사용했다"며 "페이스북의 로베르타(RoBerta) 등과 같이 해외 공룡IT기업들이 지닌 텍스트 기반 AI 언어모델과 비교할 때 거의 비슷한 수준의 성능을 발휘한다"고 설명했다.

펫버트 개발에 기술 자문으로 참여한 이상준 숭실대 교수는 "특정 영역에선 구글 버트와 같은 범용적 언어모델을 활용하는 데 한계가 있다"며 "IP(지적재산권) 업계에 특화된 펫버트가 향후 특허시장에 미칠 영향력은 매우 클 것"이라고 말했다.

펫버트는 새로운 기술특허를 출원하려는 스타트업에게 도움이 된다. 특히 과학기술 분야 정부출연연구기관이나 기업들은 장기간의 R&D(연구·개발)을 통해 개발한 기술특허가 중복, 침해되는 사례를 막기 위해 선행기술조사를 진행하는 데 이를 획기적으로 단축할 수 있을 뿐만 아니라 선도적 R&D 전략을 수립에도 도움을 받을 수 있다.

윤 대표는 "특허 분석 정보는 미래 기술 동향과 산업의 변화를 파악해 앞으로 어떤 연구를 해야 할지, 기존 제품을 고도화하기 위해 어떤 개발 전략을 세워야 할지를 예측하는데 필요하다"면서 "패스트팔로우(빠른 추격자)에서 진정한 퍼스트 무버(선도자)로 전환하기 위해 반드시 갖춰야 할 정보"라고 강조했다.

[머니투데이 미디어 액셀러레이팅 플랫폼 '유니콘팩토리']



머니투데이 주요뉴스

"6만전자보다 매력적" 외국인 소리없이 줍줍한 韓소부장 주식

네이버 메인에서 머니투데이 구독 카카오톡에서 머니투데이 채널 추가

베스트클릭

오늘의 꿀팁

  • 날씨
  • 건강쏙쏙

많이 본 뉴스

부동산 유튜브 정보채널 부릿지
부꾸미
사회안전지수

포토 / 영상

머니투데이 SERVICE