728x90
영화 <아이언맨>의 인공지능(AI) 만능 집사 ‘자비스’나 영화 <허(Her)>에 등장하는 OS(운영체제) ‘사만다’는 인간처럼 생각하며 주인공과 자연스럽게 대화를 나눈다. 인간보다 말을 더 잘하고 전문 지식까지 갖춘 자비스와 사만다의 능력은 초거대 AI에서 나옵니다. 이렇게 영화에 보던 더 똑똑한 AI를 개발하기 위한 기업들의 테크 경쟁이 초거대 AI로 확대되고 있습니다.
초거대 AI
초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라스트럭처를 기반으로 대규모 데이터를 스스로 학습하는 기술입니다.
초거대 AI는 AI의 성능을 가늠할 수 있는 파라미터(변수)가 기존 AI보다 최소 수백 배 이상 많습니다.
파라미터는 뇌에서 뉴런 간 정보 전달 통로 역할을 하는 시냅스와 비슷한 역할을 수행하며, 파라미터의 규모가 커서 AI 지능이 높은 초거대 AI는 기존 AI와 달리 특정 역할에 국한되지 않고 스스로 생각하고 학습하며 판단합니다.
카카오의 초거대 AI KoGPT 공개
‘초거대AI’를 선점하기 위한 네이버와 카카오의 AI 기술 확보 경쟁이 치열해지고 있습니다. 네이버가 국내 최초로 초거대 AI ‘하이퍼클로바’를 공개한 후 반년 만에 카카오도 초거대 AI ‘KoGPT’를 선보였는데요. AI 기술의 자립도를 높이고 미래의 AI 생태계에서 우위를 점하기 위해 초거대AI 기술 확보가 기업의 중심 과제가 되고 있습니다.
우리나라는 KoGPT를 통해 한국어 특화 초거대 AI를 총 2개 확보하게 되었습니다. 초거대 AI는 슈퍼컴퓨터를 기반으로 대용량 데이터를 빠르게 처리할 수 있고, 적은 데이터만으로도 빠른 학습이 가능한데요. 데이터 분석과 학습을 넘어 인간의 뇌처럼 스스로 추론하고 창작할 수 있다는 점에서 수많은 분야로 활용 가능한 초거대 AI는 IT업계 시장의 흐름을 바꿀 것으로 예상됩니다.
하이퍼클로바와 맞붙는 KoGPT
전 세계적인 초거대 AI 개발 경쟁에서의 핵심은 큰 모델을 구현하는 것입니다.
보통 매개변수의 규모가 커질수록 AI 성능이 높아지기 때문이죠. 다만, KoGPT의 매개변수는 60억개로 하이퍼클로바가 2,040억개, 일론 머스크가 설립한 오픈AI의 GPT-3가 1,750억개임을 고려하면 모델 규모가 훨씬 작습니다.
또, 학습 데이터를 살펴봐도 기존 모델들에 비해 규모가 작은데요. KoGPT는 2,000억개 토큰, 하이퍼클로바는 5,600억개 토큰의 한국어 데이터를 기반으로 개발됐습니다. 하이퍼클로바는 학습 데이터 중 한국어 비중이 97%에 달해 세계에서 가장 큰 한국어 거대 언어모델을 구축했죠. 네이버는 이미 검색어 교정, 쇼핑 기획전 생성, 쇼핑 리뷰 요약 등 다양한 서비스에 이를 적용하고 있습니다.
규모는 조금 작지만 KoGPT도 하이퍼클로바와 같이 한국어 특화 모델로 다양한 기능을 제공합니다.
KoGPT는 문장의 긍정과 부정 판단, 긴 문장 한 줄 요약, 결론 예측, 문맥을 이해하고 질문에 답하기 등 다양한 언어 과제를 처리할 수 있는데요. 맥락에 따라 자동으로 글을 쓸 수도 있어 향후 상품 소개 글 작성, 감정 분석, 기계 독해, 기계 번역 등에 활용될 수 있을 것으로 보입니다.
하이퍼클로바와 다른 KoGPT 만의 특징은 대중성입니다. KoGPT 사용 대상은 사회적 기업, 소셜 벤처, 스타트업 등입니다. 모델을 최초 공개하는 동시에 KoGPT를 최대 오픈소스 커뮤니티 깃허브에 오픈 소스로 무료 개방한 점도 대중성에 부합하는데요. 네이버는 하이퍼클로바의 대중화를 강조했지만, 모델을 깃허브에서 공개하지 않았습니다.
글로벌 빅테크
국내에선 최근 들어 초거대 AI가 핵심 키워드로 떠올랐지만 글로벌 빅테크 기업들은 이미 GPT-3 등을 활용한 AI 서비스 상용화에 나섰다. GPT-3 기반의 AI 애플리케이션만 300여 개에 달하는 것으로 알려졌습니다.
초거대 AI 개발 경쟁 불붙인 GPT-3
초거대 AI는 일론 머스크 테슬라 최고경영자(CEO) 등이 주도해 설립한 AI 연구기관 미국 오픈AI가 작년 초거대 AI 언어모델인 ‘GPT-3’를 공개하면서 주목받고 있습니다다. GPT-3는 1750억 개의 파라미터를 갖추면서 이전 버전(GPT-2·15억 개)보다 117배나 많은데요
GPT-3는 모델의 크기가 비약적으로 커진 만큼 과거에 못했던 고난도 일을 해내고 있습니다.
GPT-3는 모델의 크기가 비약적으로 커진 만큼 과거에 못했던 고난도 일을 해내고 있습니다.
기존 AI는 특정 주제나 키워드에 대해 정해진 답을 주로 했다면 GPT-3는 여러 분야에 걸쳐 어떤 말이든 잘 알아듣고 문장을 직접 생성해 질문에 맞는 답변을 합니다. 소설·에세이를 쓰거나 장문의 글을 요약하는 능력도 탁월합니다.
일상 언어를 컴퓨터 프로그래밍 언어로 번역해서 애플리케이션(앱) 개발에 필요한 코딩까지 합니다.
월스트리트저널(WSJ) 등 주요 외신들은 “GPT-3가 인간과 거의 동등한 수준의 언어능력을 갖췄다”며 “GPT-3기반의 AI는 서류 요약, 외국어 번역, 보고서 작성, 이메일 작성 등 사람 수준의 작업이 가능하기 때문에 업무 생산성이 크게 향상될 것”이라고 평가했습니다.
문제는 GPT-3는 언어별 학습 데이터 비중에서 영어가 92.7%로 압도적으로 높고 한국어는 0.1% 미만이어서 영어 전용 모델에 가깝다는 것입니다. 자연스럽게 한국어 성능은 제한적일 수 있다는 지적이 있습니다.
월스트리트저널(WSJ) 등 주요 외신들은 “GPT-3가 인간과 거의 동등한 수준의 언어능력을 갖췄다”며 “GPT-3기반의 AI는 서류 요약, 외국어 번역, 보고서 작성, 이메일 작성 등 사람 수준의 작업이 가능하기 때문에 업무 생산성이 크게 향상될 것”이라고 평가했습니다.
문제는 GPT-3는 언어별 학습 데이터 비중에서 영어가 92.7%로 압도적으로 높고 한국어는 0.1% 미만이어서 영어 전용 모델에 가깝다는 것입니다. 자연스럽게 한국어 성능은 제한적일 수 있다는 지적이 있습니다.
미국 오픈AI는 2030년쯤에는 파라미터가 100조 개에 달하는 GPT-4를 공개할 예정입니다.
초거대 AI 분야로 확대되는
미중 기술 패권 전쟁
미국과 중국을 중심으로 GPT-3를 능가하는 초거대 AI 개발 경쟁도 치열합니다.
구글은 지난 2월 파라미터 수가 최대 1조6000억 개에 달하는 초거대 AI ‘스위치 트랜스포머(Switch Transformer)’를
공개했데요. 이에 맞서 지난 6월 중국 정부의 지원을 받고 있는 베이징 지위안 인공지능 연구원(The Beijing Academy of Artificial Intelli gence·BAAI)은 파라미터 수가 1조7500억 개에 달하는 ‘우다오(WuDao) 2.0’을 내놨습니다.
우다오 2.0은 중국 전통 문체로 시를 창작할 수 있고, 이미지 생성과 인식 능력이 빼어난 것으로 알려으며,
우다오 2.0은 중국 전통 문체로 시를 창작할 수 있고, 이미지 생성과 인식 능력이 빼어난 것으로 알려으며,
홍콩 사우스차이나모닝포스트(SCMP)는 “우다오 2.0은 미국 오픈AI와 구글을 뛰어넘는 수준”이라며
“미중 기술 패권 전쟁이 초거대 AI 분야로 확전되고 있는 양상”이라고 진단했습니다.
앞으로 KoGPT 개발 방향은?
카카오브레인은 향후 언어모델 규모 100배 이상 확대, 단점을 극복하기 위한 알고리즘 재설계, 대규모 언어 데이터셋 구축 등을 추진하겠다고 밝혔습니다. 특히 한국어뿐만 아니라 영어, 일본어, 베트남어 등 동남아시아 언어까지 확장해서 더 많은 곳에서 AI 기술의 혜택을 누릴 수 있게 할 예정이죠.
특히 향후 초거대 AI에 블록체인 기술을 더하는 것을 검토한다는 점에서 기존 모델들과 다릅니다.
블록체인 위에서 언어모델은 추가되는 데이터를 반영해서 학습되고 모델 규모도 지속해서 커지는데요.
언어모델 학습 연산을 도와주거나 데이터를 제공하는 등 기여한 사람들은 모델의 지분 일부를 갖게 되고,
누군가 모델을 사용했을 때 사용료를 지분만큼 지급받는 생태계를 구상하고 있습니다.
카카오는 컨퍼런스에서 KoGPT를 공개한 것 외에도 수수료 제로 개방형 거래 플랫폼 구축 계획, 카카오톡 신분증을 이용한 디지털 사원증과 디지털 명함인 톡명함 성과 등을 발표했는데요.
네이버의 컨퍼런스 데뷰는 오는 24일 열릴 예정입니다.
정석근 네이버 클로바 CIC 대표는 “AI는 이제 규모와 속도의 경쟁에 돌입했다”고 진단했습니다.
정 대표는 “초거대 AI라는 하나의 커다란 모델을 만들어 다양한 문제에 적용할 수 있다”며
“더 짧은 시간에 더 적은 리소스로 이전에 우리가 상상하지 못했던 일까지 가능하게 만들어 줄 것”이라고 말했습니다.
728x90
'www > 뉴스,세상사' 카테고리의 다른 글
궁지에 몰린 애플 (0) | 2021.11.19 |
---|---|
바이든 취임 후 첫 미국-중국 정상회담 (0) | 2021.11.18 |
위드 코로나, 항공업계 양극화 (1) | 2021.11.17 |
파운드리 업계_반도체 부족 (0) | 2021.11.16 |
광군제에도 고전하는 알리바바 (0) | 2021.11.15 |