지난 21일 우리학교 지식출판콘텐츠원은 한국지능정보사회진흥원(National Information society Agency)(이하 NIA)과 과학기술정보통신부가 주최한 ‘인공지능학습용 데이터 구축사업’을 수주했다. 사업에 선정된 지식출판콘텐츠원은 1년간 약 96억 원을 지원받아 우리학교 데이터센터와의 협업을 통해 다양한 외국어 관련 사업을 진행할 예정이다. 고윤성 우리학교 지식출판콘텐츠원장은 “인공지능의 구체적인 구현을 위해선 언어 공학적 설계가 필요하다”며 “이번 사업의 수주는 우리학교의 언어 공학에 대한 전문성을 높이 평가받은 성과라고 생각한다”고 답했다. 이번 사업엔 우리나라 사람을 위한 다국어 음성 데이터 교육과 자연어 분석 데이터 구축을 목표로 △외국어 발화 평가 표준체계 수립△음성인식 및 통·번역 모델 설계△자동 문법교정 시스템 확장 등을 실행할 것이다. 이를 통해 구축된 데이터는 지식출판콘텐츠원과 데이터센터에서 보관돼 추후 다양한 기업과의 협업을 통해 외국어 교육용 인공지능 모델 및 외국어 음성 인식기 개발에 활용될 예정이다. 이번 사업의 총괄을 맡은 한승희 우리학교 데이터센터 책임연구원은 “기계번역 및 외국어 음성인식에 대한 학습데이터 수집 과정에서 우리학교 학생의 참여를 우선적으로 받을 계획이다”며 데이터 사이언스에 관심이 많은 학생이라면 실무를 먼저 경험할 수 있는 기회가 될 것이란 입장을 전했다. 이에 장도은(아시아·마인어 21) 씨는 “언어 공학과 인공지능에 관심이 많아 현재 ‘Language&Ai’ 트랙을 융합 전공으로 공부 중이다”며 “이번 사업에 참여할 수 있는 기회가 생겨 기쁘다”고 전했다. 한편 지난해에도 우리학교 지식출판콘텐츠원과 데이터센터가 협업해 총 약 38억여 원 규모의 사업을 수주한 바 있다. 이에 지난 1년간 인공지능·자연어 기술 전문 기업 ‘솔트룩스(Saltlux)’와 협업해 △다국어 구어체 번역 말뭉치 구축△한국어·영어·중국어 음성데이터 구축△인공지능 통번역기 개발에 관한 사업을 진행했다.
김하형 기자 03hahyung@hufs.ac.kr