KT AI원팀, 공동연구 성과 4종의 AI 기술 공개

KT AI원팀, 공동연구 성과 4종의 AI 기술 공개

  • 기자명 김강석
  • 입력 2022.04.14 14:53
  • 0
  • 본문 글씨 키우기
이 기사를 공유합니다

[더퍼블릭 = 김강석 기자] KT는 산학연 인공지능(AI) 연구 협력체 ‘AI 원팀’이 AI 기술 4종을 개발했다고 14일 밝혔다.

이들이 개발한 4종의 기술은 ▲로봇 실내 공간지능 기술 ▲로봇 소셜 인터랙션(Social Interaction) 기술 ▲보이스 클로닝(Voice Cloning) 기술 ▲한국어 E2E(End to End) 음성인식 트랜스퍼 러닝(Transfer learning) 기술로, KT는 자사 AI 사업 및 서비스에 이들을 활용할 예정이다.

로봇 실내 공간지능 기술은 로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억하는 기술이다. 로봇이 공간 내에서 특정 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성하고, 실시간 업데이트를 가능하게 만든다.

로봇 소셜 인터랙션 기술은 사용자의 얼굴 및 행동을 인식한 후, 로봇이 수행할 행동을 추천하는 알고리즘을 구현했다. KT 로봇은 향후 이와 같은 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.

보이스 클로닝 기술은 개인화 음성합성을 위한 목소리 복원 알고리즘으로, 개인의 오디오 샘플을 딥러닝으로 학습해 커스텀 보이스를 제공하는 개인화 TTS 서비스의 핵심 기술이다. 이번 연구에서 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축했다. 차후 이 기술을 기가지니, AI통화비서, AI 로봇, AI 교육 등에 도입해 ‘커스텀 개인화 TTS 서비스’를 상용화할 예정이다.

KT에 따르면, 한국어 End-to-End 음성인식 트랜스퍼 러닝 기술은 한국어 음성인식 성능을 높이면서도 학습에 필요한 데이터를 줄여줘 세계 최고 수준의 음성인식 성능을 갖췄다.

[사진제공=KT]

더퍼블릭 / 김강석 기자 kim_ks0227@thepublic.kr 

더퍼블릭 / 김강석 kim_ks0227@thepublic.kr

저작권자 © 더퍼블릭 무단전재 및 재배포 금지
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
모바일버전