속보
VIP
통합검색

전문가들도 관심 대폭발..."GPT-4 진보 놀라워, 일부 한계점도"

머니투데이
  • 배한님 기자
  • 카카오톡 공유하기
  • 카카오톡 나에게 전송하기
  • 페이스북
  • 트위터
  • 네이버
  • 카카오스토리
  • 텔레그램
  • 문자
  • 2023.03.15 16:32
  • 글자크기조절
14일(현지시각) 공개된 GPT-4 소개 페이지. /사진=오픈AI 홈페이지 갈무리
14일(현지시각) 공개된 GPT-4 소개 페이지. /사진=오픈AI 홈페이지 갈무리
오픈AI가 GPT-4를 깜짝 공개하면서 IT 전문가들의 관심도 대폭발했다. 이들은 이미지의 맥락까지 이해하고 설명해주는 멀티모달(Multimodal) 기능뿐만 아니라 전문지식이 늘었고, 긴 글까지 이해하는 고급 추론 기능이 추가되면서 생산성이 크게 향상됐다고 평가했다. 그러나 여전히 할루시네이션(환각)을 완전히 해결하지 못했고, 답변 생성 속도 등으로 미루어 GPT-3.5에서 파라미터(매개변수)를 크게 늘리지는 못한 것으로 봤다.

삼성생명 소속 데이터 사이언티스트 이상훈 씨는 한국 텐서플로 페이스북에 GPT-4 기술 리포트를 리뷰하며 "대부분 시험에서 큰 향상을 보여주고 있고, GPT-3.5 대비 각종 벤치마크 점수를 크게 갱신했다"며 "특히 GPT-3.5의 영어 정확도(70.1%)보다 GPT-4의 한국어 정확도(77.0%)가 높아진 점이 가장 인상 깊었다"고 말했다. GPT-4의 영어 정확도는 85.5%였는데, GPT-4는 영어뿐만 아니라 다양한 언어의 독해 능력까지 끌어올렸다는 의미다.

전문가들은 마이크로소프트(MS)와 손잡은 오픈AI가 유료 가입자 확보를 위해 GPT-4의 생산성 향상에 집중했으리라 추측했다. B2B 측면에서 기업들이 기꺼이 구매할 물건을 만들었다는 것이다. 하정우 네이버 AI연구소장은 "B2B 향으로 정말 지갑을 제대로 열게 할 쓸만한 물건을 만들어 낸 느낌"이라고 강조했다.

하 소장은 "변호사시험이나 SAT, GRE 같이 특정 범위에 대해서는 상위 10%를 기록할 만큼 믿을 수 있는 답변을 하게 됐으니 상당히 믿을 수 있는 생산성 도구다"며 "마이크로소프트(MS) 클라우드 비즈니스 관점에서는 합이 굉장히 잘 맞는 도구다"고 설명했다.

오픈AI에 투자한 MS는 오는 16일(미 현지 시각) 'AI와 함께하는 일의 미래(Future of Work with AI)' 컨퍼런스를 개최한다. 이 자리에서 사티아 나델라 MS CEO는 AI를 통해 '일하는 방식의 변화', 즉 생산성 확대가 어떻게 이루어질지 직접 설명할 예정이다. 하 소장은 "(GPT-4를 보고 나니 MS가) 그래서 Productivity(생산성)를 강조했구나 싶었다"고 덧붙였다.


여전히 거짓말을 하는 GPT·응답 속도 변화 없어…"예상했던 수준 벗어나지 않아"



다만 일부에서는 한계점을 지적하는 목소리도 있다. 파라미터가 100조 수준으로 늘어날 것이라는 전망과 달리 크게 늘지않았다는 평가나 멀티모달역시 이미지 맥락을 이해하지만 음성·이미지·영상을 이해·생성하는 수준에는 아직 못미쳤다는 평가다.

하 소장은 "GPT-4는 GPT-3.5 레거시 모드와 속도가 동일한 것으로 나오는데 이를 통해 추산하면 모델 크기가 그리 많이 커지지 않았다고 봐야 될 것 같다"며 "맥락 전체를 볼 수 있는 총 글의 길이가 많이 늘었다는 것을 고려해도 세간에서 이야기하는 100조 파라미터는 말도 안 되는 소리 같다"고 설명했다.
[서울=뉴시스] 권창회 기자 = 출판계에 대화형 인공지능(AI) 챗GPT 바람이 거세다. 예스24에 따르면 1월 '챗GPT' 도서 판매량은 전월 대비 3.4배 증가한 데 이어 2월에는 94.5배로 급증했다. 사진은 9일 오후 서울 시내 대형서점에 진열된 챗GPT 관련 도서. 2023.03.09.
[서울=뉴시스] 권창회 기자 = 출판계에 대화형 인공지능(AI) 챗GPT 바람이 거세다. 예스24에 따르면 1월 '챗GPT' 도서 판매량은 전월 대비 3.4배 증가한 데 이어 2월에는 94.5배로 급증했다. 사진은 9일 오후 서울 시내 대형서점에 진열된 챗GPT 관련 도서. 2023.03.09.
실제 유료 서비스인 챗GPT 플러스 사용자들은 이날부터 GPT-4를 체험할 수 있게 됐는데 GPT-4가 GPT-3.5와 속도 차이가 없다고 입 모았다. 특히 챗GPT 플러스 사용자 중 속도가 향상된 '터보' 모드를 이용했던 사용자들은 "오히려 느려졌다"고 불평했다.

아울러 테크 리포트에 따르면 GPT-4가 GPT-3.5보다 정답을 내놓을 확률, 할루시네이션에 빠지지 않을 확률이 40% 높지만 여전히 할루시네이션이 완전히 해결되지 않았다고 꼬집었다.

전문가들은 오픈AI가 GPT-4와 관련 정보를 공개하지 않는 점도 아쉽다는 반응이다. 지금까지 오픈AI는 주로 R&D(연구·개발) 영역에서 활동하며 AI 생태계 전반의 발전에 기여해왔다. 그러나 GPT-3.5부터 파라미터 수를 비밀에 부치는 등 모델의 자세한 내용을 공개하지 않고 있다.

이상훈 씨는 "이제는 API도 실무에 바로 쓰일 수 있도록 확대 제공하고 킬러앱 영역으로의 진출까지 고려하고 있다"며 "이미 텍스트 생성 AI 앱 재스퍼는 유료 구독자를 많이 잃었다고 한다"고 했다. 기술 발전과 함께 경쟁이 심화되면서 오픈AI가 이제 연구 집단이 아닌 하나의 기업으로 변화하는 것으로 풀이된다.

하 소장은 "오픈AI는 윈도우 초창기의 영화를 다시 한번 걸어보겠다는 MS 때문에 앞으로 (모델 공개를) 못할 것 같지만, 만약 구글의 팜(PaLM)이 메타의 라마(LLaMA)처럼 모델을 공개하고 사용성이 늘면 패권이 어떻게 변화할지 모른다"고 지적했다.



머니투데이 주요뉴스

엔화 살까요, 말까요?…'70억 자산가' 달러 투자 달인의 답은
네이버 메인에서 머니투데이 구독 카카오톡에서 머니투데이 채널 추가

베스트클릭

오늘의 꿀팁

  • 뉴스 속 오늘
  • 더영상
  • 날씨는?
  • 헬스투데이

많이 본 뉴스

골프 최고위 과정
풀민지
[연중기획] 인공지능 시대의 생존법, AI 리터러시 키우자

포토 / 영상