국가대표 인공지능(AI) 선발 기준을 둘러싼 논란이 좀처럼 가라앉지 않고 있다. 1차 평가 이후 ‘독자성’ 기준을 둘러싼 혼선이 이어지는 가운데, 2차 평가에서는 멀티모달 구현 여부가 핵심 변수가 될 전망이다.
28일 업계에 따르면 정부가 추진 중인 ‘독자 AI 파운데이션 모델 개발 프로젝트(독파모)’는 1차 단계평가 이후 기준 논란과 일정 조정이 맞물리며 불확실성이 커진 상태다.
앞서 과학기술정보통신부는 1월15일 1차 평가 결과를 발표하고 LG AI연구원·SK텔레콤·업스테이지 등 3개 컨소시엄을 2차 평가 진출팀으로 선정했다. 반면 네이버클라우드는 중국산 모듈을 사용해 독자성이 부족하다는 이유로 탈락했고, NC AI는 5개 팀 가운데 AI 모델 성능이 가장 낮다는 평가를 받아 고배를 마셨다.
특히 논란의 중심에는 네이버클라우드 탈락 사유로 제시된 ‘독자성’ 기준이 있다. 정부는 네이버클라우드가 중국 알리바바의 ‘큐웬(Qwen) 2.5’ 비전 인코더 가중치를 그대로 활용한 점을 문제 삼으며, “가중치를 초기화한 뒤 학습·개발을 수행하는 것이 독자성 확보의 최소 조건”이라고 밝혔다. 하지만 업계에서는 오픈소스 활용 허용 범위와 모듈·인코더 단위 판단 기준이 사전에 명확히 제시되지 않았다는 지적이 이어지고 있다.
논란은 정부가 추가 정예팀 선발에 나서면서 더욱 확대됐다. 과기정통부는 네이버클라우드 탈락으로 발생한 공석을 채우기 위해 1월23일부터 3월12일까지 추가 정예팀 1곳을 공개 모집 중이다. 이에 따라 당초 연말로 예정됐던 2개 정예팀 압축 일정은 2027년 1분기로 연기됐다.
1차 평가에서 탈락한 네이버클라우드와 NC AI는 물론, 본선 문턱에서 고배를 마신 KT·카카오·카이스트(KAIST)까지 재도전에 참여하지 않겠다는 입장을 밝혔다. 한 업계 관계자는 “프롬 스크래치 등 통과 기준이 어디까지 적용되는지 불분명한 상황에서 재도전은 리스크가 크다고 판단했을 것”이라고 말했다.
이처럼 독자성 기준을 둘러싼 논란이 해소되지 않은 가운데, 업계의 시선은 자연스럽게 2차 평가로 옮겨가고 있다. 1차 평가가 텍스트 기반 초거대언어모델(LLM) 성능 경쟁이었다면, 2차 평가는 ‘멀티모달’ 구현 여부가 핵심 변수가 될 것이라는 관측이 나온다. 정예팀들 역시 멀티모달을 차기 평가의 주요 기준으로 보고 준비에 착수한 상태다.
멀티모달은 AI가 텍스트뿐 아니라 이미지·음성·영상 등 다양한 형태의 데이터를 동시에 이해하고 처리하는 기술로, 보다 사람에 가까운 복합적인 판단을 할 수 있게 한다.
SK텔레콤은 2단계 개발부터 자사 LLM ‘A.X-K1’에 멀티모달 기능을 본격 도입할 계획이다. 우선 논문이나 업무 문서 이미지를 인식해 텍스트로 요약하는 기능을 적용하고, 하반기 이후에는 음성과 영상 데이터까지 처리 범위를 넓힌다는 구상이다. 이와 함께 학습 데이터 규모를 확대하고, 학습 언어를 한국어·영어·중국어·일본어·스페인어 등 5개 국어로 늘려 모델 활용도를 높일 계획이다.
LG AI연구원은 엑사원(EXAONE) 초기 버전부터 멀티모달을 염두에 둔 모델 개발을 이어온 만큼, 기존에 축적한 기술과 대규모 서비스 데이터를 기반으로 고도화에 나서고 있다는 설명이다. 업스테이지 역시 단계적으로 언어와 이미지를 통합적으로 이해하는 멀티모달 기능을 확보하겠다는 방침을 밝혔다.
스타트업 진영도 멀티모달 준비에 나서고 있다. 모티프테크놀로지스와 트릴리온랩스는 고성능 LLM과 멀티모달 모델 개발 경험을 앞세워 경쟁에 뛰어들고 있으며, 차기 평가를 염두에 둔 기술 고도화를 이어가고 있다.
업계에서는 정부가 독자성 기준과 검증 절차를 명확히 하지 않는 한, 멀티모달 경쟁 과정에서도 유사한 논란이 반복될 가능성이 크다고 보고 있다. 이재성 중앙대학교 AI학과 교수는 “1차 평가에서 네이버가 옴니모달 방향으로 차별화를 시도하면서 인코더 논란이 불거졌다”면서 “정부가 기업들이 헷갈리지 않도록 명확한 평가 기준을 제시해야 한다”고 지적했다.







