올해로 24주년을 맞은 인터스피치는 음성 AI 분야 세계 최대 규모 학회 중 하나다. 전 세계 자연어(NLP) 처리, 음성인식 인공지능 전문가와 언어 및 음성학자들이 참여하고 있다.
올해 인터스피치가 진행하는 'INTERSPEECH 2023' 행사는 8월 20일부터 나흘 간 아일랜드 더블린에서 열린다. 행사는 '전인류적 포용'을 주제로 성별, 언어, 억양에 관계없이 누구에게나 가치 있고 유용한 음성기술 연구 내용을 발표하는 자리가 될 예정이다.
엔씨의 AI 센터 산하 'Speech AI Lab' 조직은 그동안 세계적인 권위를 가진 AI 학회에 관련 연구 결과들을 공유해왔다. 인터스피치에도 4년 연속 논문을 게재하고 있으며 올해도 3편의 논문이 채택됐다.
올해 게재된 논문의 주제는 ▲사용자 정의 호출어 인식 기술 ▲기존 감정인식 기술을 대폭 개선한 새로운 멀티모달 감정인식 기술 개발 ▲서버 통신 없이 웹브라우저에서 구동 가능한 고속/경량의 호출어 인식 모델 제안 등이다. 해당 논문들은 사람과 AI 사이에서 자연스러운 상호작용을 이뤄내기 위한 기반 기술들이라는 점에서 의미가 있다.
엔씨소프트 김희만 Speech AI Lab 실장은 "세계적인 권위를 갖는 AI 학회에 4년 연속으로 논문을 게재한 것은 엔씨소프트 음성 AI 기술이 이미 세계 정상급이라는 점을 보여주는 사례"라며 "앞으로 음성 기술뿐만 아니라 모든 소리를 아우를 수 있는 청각 지능 연구를 진행하고 이를 통해 진정한 디지털 휴먼 완성에 기여하겠다"고 말했다.
인터스피치 게재 논문에 대한 자세한 내용은 테크 블로그 'NC Research' 웹페이지를 통해 확인할 수 있다.
안종훈 기자 (chrono@dailygame.co.kr)