“문제는 데이터 주권” 한국어 특화 LMM 강조하는 이재명‧김문수

“문제는 데이터 주권” 한국어 특화 LMM 강조하는 이재명‧김문수

  • 기자명 김미희 기자
  • 입력 2025.05.28 14:51
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

[더퍼블릭=김미희 기자]AI시대가 본격화되면서 대선 후보인 더불어민주당 이재명 후보와 국민의힘 김문수 후보가 나란히 한국어 특화 대규모언어모델(LLM)을 강조하고 나섰다. 반면 개혁신당 이준석 후보의 경우 ‘모호하고, 갈라파고스 우려가 있다’는 취지로 비판적인 입장을 견지했다.

현재 우리나라는 우라나라만의 독보적인 거대 언어모델(LLM)이 없는 상황이다. 이에 양 후보 모두 한국어 특화 대규모언어모델(LLM)을 강조하고 나선 것이다.

27일 디지털데일리 보도에 따르면 기본적인 발상은 양측 모두 유사하다고 전했다. 국내에서 자체 개발한 LLM을 통해 국민의 AI 접근성을 높이고, 산업에서 AI 활용도를 높이겠다는 취지다. 더불어 국가 간 차이가 희미해지고 있는 상황 속에서 국가 고유 데이터가 학습된 LLM으로 한국 특화 AI 소프트웨어 기술을 확보하고, 기술 정체성을 확립하고자 하는 의도도 돋보인다.

반면 관련해 이준석 개혁신당 대통령 후보는 회의적인 입장이다. 특히, 이재명 후보를 향해 공약이 모호하고 갈라파고스 우려가 있다는 취지로 비판한 바 있다.

디지털데일리 보도에 따르면 AI는 언어 국경을 초월하는 기술이다. 한국인 다수가 미국 기업 오픈AI의 기술을 활용하고 있다. 언어적 장벽이 낮아지면서 영어 실력과 상관없이 각국 AI를 사용할 수 있지만, 한국에만 존재하는 데이터 등에 대한 학습이 부족한 AI 경우, 한국 고유의 문화나 사회 관련 내용을 답할 때 다소 빈약하거나 틀린 답변을 내놓는 경우가 있다.

이 매체 보도에 따르면 이는 AI의 편향성 문제나 학습데이터 차이에 따른 것으로 해석된다. 통상적으로 AI는 데이터를 대규모·반복 학습함으로써 보다 풍부하고 정확한 답변을 내놓을 ‘확률’이 증가하기 때문이다.

아울러 데이터 주권문제와도 연결된다. 현재 많은 AI 기업들이 자사 LLM을 오픈소스로 공개하고 있지만, 여전히 많은 AI 기업에서는 LLM 오픈소스를 영업비밀에 부치며 공개하지 않는 상황이다. 이는 결국 데이터나 기술 해외 의존도를 높이는 결과를 초래할 수 있다. 이에 따라 한국의 데이터로, 한국의 기술로 제작된 LLM이 필요하다는 주장도 제기된 바 있다.

이에 양 후보 모두 한국어 LMM의 중요성을 강조한 것으로 풀이된다. 더불어민주당은 3대 비전 중 ‘급변하는 대외 환경과 저출생·경제위기를 해결하기 위한 성장’ 아래는 AI 등 신산업 직접 육성을 통한 성장동력 마련을 위한 공약이 비중 있게 제시됐다. 민주당은 “인공지능 대전환을 통해 AI 3강으로 도약하겠다”며 인공지능 생태계 핵심기술 및 기반 확보, 세계 최고의 AI 인재 양성체계 마련을 공약으로 내걸었다.

이를 위해 대통령 직속 기구인 국가인공지능위원회의 역할을 강화하고 대통령실에 ‘AI정책수석’도 신설한다는 게 민주당의 방침이다.

국민의힘 김문수 후보의 경우 대통령 직속 국가AI위원회, 국가바이오위원회, 양자전략위원회, 국가우주위원회 등을 구성해 미래 기술도 적극적으로 육성하겠다고 밝혔다. 국가 예산지출의 5% 이상을 연구개발(R&D)에 투자하고, 과학기술부총리와 과학특임대사도 신설한다.

2032년 달 착륙, 2045년 화성 탐사 등 우주 경제 로드맵도 추진하겠다고 공약했다.

더퍼블릭 / 김미희 기자 thepublic3151@thepublic.kr

저작권자 © 더퍼블릭 무단전재 및 재배포 금지

응원하기

관련기사
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전