'ICASSP'는 매년 전 세계 각국에서 개최되는 국제학술대회로, 49회를 맞이한 올해 서울 코엑스에서 진행된다. 행사에는 전 세계 과학자 4000여 명이 참석해 신호처리 기술을 비롯한 각종 멀티모달 생성형 AI 기술을 발표한다.
엔씨는 'ICASSP 2024'에 멀티모달 언어모델의 시각적 환각 현상 완화, 열악한 환경 속 얼굴 인식 정확성 개선, 사용자 음성을 깨끗하게 걸러내는 호출어 인식 모델, 얼굴 이미지에 맞는 가상 음성 생성 시스템 총 4편의 논문을 게재했다.
엔씨가 발표한 논문들은 실질적 활용을 위한 AI 응용 기술과 함께 텍스트, 이미지, 비디오, 음성 등 다양한 데이터를 이해하고 학습하는 멀티모달 언어모델 기술의 활용 가능성을 다루고 있다. 엔씨는 이번 연구 결과를 기반으로 텍스트, 이미지, 오디오 등 다양한 분야에서 멀티모달 데이터를 이해하는 AI 기술을 발전시켜 게임 개발에 활용할 계획이다.
자세한 내용은 엔씨 공식 블로그를 통해 확인할 수 있다.
이학범 기자 (ethic95@dailygame.co.kr)