- 유사 모델 대비 학습 비용 50% 절감… 효율성과 성능 동시 확보
- 경량 모델 '카나나 나노 2.1B' 오픈소스로 공개… 국내 AI 생태계 활성화 기대
카카오가 자체 개발한 초거대 인공지능(AI) 언어모델 '카나나 플래그(Kanana Flag)'의 개발을 완료하고 연구 성과를 공개했다. 27일 카카오는 자체 AI 모델 '카나나(Kanana)'의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개하고, 경량 모델인 '카나나 나노 2.1B'를 오픈소스로 배포했다고 밝혔다.
'카나나 플래그'는 글로벌 최고 수준의 한국어·영어 성능을 달성한 모델로 평가받고 있다. 한국어 성능을 평가하는 'LogicKor'와 'KMMLU' 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했으며, 영어 성능을 평가하는 'MT-bench'와 'MMLU' 벤치마크에서도 경쟁 모델과 유사한 성과를 기록했다.
특히 카카오는 혁신적인 학습 기법을 적용해 학습 비용 문제를 해결했다. 카카오는 ▲Staged pre-training ▲Pruning ▲Distillation ▲DUS(Depth Upscaling) 등의 기법을 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하면서도 최고 수준(SOTA)의 효율성과 성능을 동시에 구현해냈다.
카카오는 이번 성과를 통해 '카나나 플래그', '에센스', '나노' 등 카나나 언어모델의 전체 라인업을 구축 완료했다. 경량 모델인 '카나나 나노 2.1B'부터 초거대 모델인 '카나나 플래그 32.5B'까지 다양한 사이즈의 고성능 모델을 효율적으로 개발했다.
국내 AI 생태계 활성화를 위해 카카오는 경량 모델인 '카나나 나노 2.1B'를 깃허브(GitHub)를 통해 오픈소스로 공개했다. 이 모델은 연구자와 개발자가 활용하기 적절한 크기로, 온디바이스(On-device) 환경에서도 활용 가능한 고성능 경량 모델이다. 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 보여주며, 한국어와 영어 처리 능력에서 뛰어난 결과를 나타낸다.
카카오는 향후 카나나 모델에 강화 학습과 연속 학습 기반의 최신 기술을 접목해 추론, 수학, 코딩 능력을 강화하고, 정렬 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획이다. 또한 음성, 이미지, 영상 등 다양한 형태로 소통 가능하도록 지속적인 모델 고도화를 이어갈 예정이다.
김병학 카카오 카나나 성과리더는 "모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐다"며, "이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것"이라고 밝혔다.
카카오의 이번 성과는 국내 기업이 글로벌 수준의 AI 기술력을 확보했다는 점에서 의미가 크다. 특히 한국어 처리 능력에서 우수한 성능을 보여 향후 국내 AI 서비스 발전에 큰 역할을 할 것으로 기대된다.