에이닷엑스 4.0의 대규모 학습을 진행한 SK텔레콤 자체 구축 슈퍼컴퓨터 '타이탄' / SK텔레콤
SK텔레콤(이하 SKT)이 7월 3일(수) 자사 개발 언어 모델 ‘A.X(에이닷 엑스) 4.0’을 오픈소스로 공개하며 한국형 AI 확산에 나섰다. 해당 모델은 글로벌 오픈소스 플랫폼인 허깅페이스(Hugging Face)를 통해 공개되며, 기업·기관·개인 모두 상업적 제약 없이 자유롭게 활용할 수 있다.
공개된 모델은 총 두 가지로, 720억 개 매개변수를 가진 표준 모델과 70억 개 매개변수를 지닌 경량 모델로 구성된다. SKT는 이번 모델이 세계 최고 수준의 한국어 처리 능력을 갖춘 LLM이며, 특히 국내 비즈니스 환경에 최적화된 성능을 보인다고 설명했다.
A.X 4.0은 오픈소스 모델인 Qwen2.5를 기반으로 방대한 한국어 데이터를 추가 학습시킨 지식형 언어 모델로, 한국어 언어 구조와 문맥에 최적화된 자체 토크나이저(tokenizer)를 도입해 높은 토큰 효율을 달성했다. 내부 테스트 결과에 따르면, GPT-4o보다 약 33% 높은 토큰 효율을 기록해 높은 정보 처리량과 비용 효율성을 동시에 구현할 수 있는 것이 강점이다.
벤치마크 성능에서도 A.X 4.0은 우수한 결과를 보였다. 대표적인 한국어 평가 지표인 KMMLU에서 78.3점을 획득해 GPT-4o(72.5점)를 상회했으며, 한국 문화 및 언어 이해력을 평가하는 CLIcK에서도 83.5점을 기록해 GPT-4o(80.2점)보다 높은 점수를 받았다.
SKT는 이번 모델을 온프레미스(On-premises) 방식으로도 제공할 예정이며, 기업 내부망에 직접 설치해 사용할 수 있도록 해 데이터 유출 우려를 줄였다. 특히 학습 단계에서도 외부 연동 없이 자체 데이터만으로 대규모 사전학습(Continual Pre-Training)을 수행해 데이터 주권을 확보했다는 점에서 주목받고 있다.
현재 A.X 4.0은 SKT의 AI 서비스인 ‘에이닷’ 통화 요약 기능 등에 이미 적용돼 있으며, 향후 SK그룹 전반의 서비스로 확대 적용될 계획이다. 기업들은 이 모델을 기반으로 독자적인 파생형 모델 개발도 가능해, 산업별 맞춤형 AI 구축의 새로운 대안이 될 것으로 기대된다.
한편 SKT는 A.X 4.0의 오픈소스 공개와 더불어, 수학 문제 해결과 코드 작성 능력을 강화한 추론형 모델과 멀티모달(텍스트+이미지) 기능이 강화된 차세대 모델도 이달 중으로 순차 공개할 계획이다. ‘프롬 스크래치(From Scratch)’ 방식으로 개발된 A.X 3.0 라인업도 병행해 후속 모델로 확대될 전망이다.
SKT 김지원 AI Model Lab장은 “A.X 4.0은 국내 비즈니스 환경에 최적화된 고성능 한국어 특화 LLM으로, 앞으로도 다양한 서비스에 적용하며 기술 고도화를 지속해나가겠다”라고 말했다.