엔씨소프트, LLM 성능 검증 'VARCO Judge LLM' 출시

김진수 기자 2024-09-23 11:27:43
엔씨소프트는 국내 최초로 거대언어모델(LLM)의 성능과 수행능력을 검증하는 평가모델 ‘VARCO Judge LLM’을 출시했다고 밝혔다. 'VARCO Judge LLM'은 다른 LLM이 얼마나 빠르고 정확하게 작업을 수행하는지 검사하는 평가모델이다. 최근 기업들은 시장에서 서비스 중인 다양한 유형, 규모의 LLM 가운데 적합한 모델을 찾기 위해 많은 시간을 소비하고 있다. 이때 'VARCO Judge LLM'을 사용하면 보다 효과적으로 자사 AI 서비스에 적합한 LLM 모델을 검증할 수 있다.

엔씨의 'VARCO Judge LLM'은 우수한 LLM 편향(Bias) 문제해결 능력과 뛰어난 한국어 성능을 자랑한다. 동급 모델 중 가장 높은 성능을 갖췄다. 특히 엔씨는 올해 세계적인 권위를 갖는 NLP 학회 ‘EMNLP(Empirical Methods in Natural Language Processing)‘에 LLM 평가모델 논문을 게재하며 글로벌 무대에서도 기술력을 입증하는데 성공했다.

엔씨의 평가모델을 활용하면 AI 기반 서비스를 만드는 기업의 경우 각종 LLM의 품질을 빠르게 비교 평가해 자사 서비스에 최적화된 모델을 채택할 수 있다. AI 모델 연구개발 기업은 자사 LLM의 성능 수준을 평가모델로 검증해 타 모델 대비 성능 우위를 증명하거나, 약점을 빠르게 파악하여 보강할 수 있다. 모델 허브(Model Hub) 사업자는 LLM을 선택, 최적화 및 배포하는 프로세스를 가속화함으로써 더욱 효과적으로 모델을 제공할 수 있다.

국내 게임사 최초로 자체 언어모델을 개발한 엔씨는 게임 개발 과정과 사내 업무 효율화 전반에 AI 기술을 적극 활용하고 있다. 이번 평가모델 출시를 통해 자체 LLM ‘바르코(VARCO)’의 품질 향상과 함께 LLM 모델 평가 분야에서 선도적 위치를 확보한다는 계획이다.

NC Research 이연수 본부장은 “빠르게 진화하는 AI 시장에서 각자 산업에 맞는 최적의 모델을 선별하고 적용하는 서비스가 더욱 중요해지고 있다”며 “VARCO Judge LLM은 기존 LLM 기반 서비스의 품질 향상을 넘어 AI 비즈니스에서 없어서는 안 될 중요한 도구로 자리매김할 것”이라고 말했다.
 

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300

"강원랜드 수사도 다시 해야"

국민의힘 권성동 의원이 정치자금법 위반 혐의를 받는 피의자 신분으로 특검에 소환됐다. 권 의원이 결백을 주장한 가운데 누리꾼들은 철저한 특검 수

전남 합계출산율 2년 연속 전국 1위

전남도는 2024년 전남지역 합계출산율이 1.03명으로 2년 연속 전국 1위를 기록한데 이어 2025년 2분기 합계출산율도 1.04명으로 전국에서 유일하게 1.0명을

HD현대중공업, HD현대미포와 합병

HD한국조선해양이 마스가(MASGA) 프로젝트의 본격 가동을 앞두고 조선업 사업재편을 통한 K-조선 및 방산 분야 글로벌 경쟁력 제고와 수주 확대에 나선다