2017/08/01 16:41:32
◇인간의 뇌 닮은 인공신경망으로 번역 ‘척척’
“100점 만점에 70점쯤 될까요? 번역 프로그램 수준을 여기까지 끌어올린 건 인공지능(AI) 덕분입니다. 아직 갈 길이 멀지만, 앞으로 7~8년 뒤면 사람의 번역 수준까지 올라갈 겁니다.”
김준석 리더가 말했다. 파파고는 인간의 뇌와 유사한 인공신경망을 기반으로 하는 ‘신경망 번역’(NMT) 서비스다. 기존의 ‘통계식 기계번역’(SMT)과 달리 학습 데이터를 스스로 학습해 더 정확한 번역이 가능하다.
“기계 번역이 단어에 집중한다면, 신경망 번역은 문장 전체를 이해합니다. 같은 학습 데이터를 넣어도 훨씬 자연스러운 결과를 내는 이유죠. 예를 들어 ‘사과’라는 단어가 들어간 문장을 번역한다고 했을 때 ‘apple’과 ‘apologize’ 중에 선택해야 하죠. SMT는 통계상 높은 확률의 단어를 선택합니다. 그래서 오류가 많을 수밖에 없었죠. 반면 NMT는 문장이나 문맥 전체를 이해한 뒤 번역하기 때문에 더 정확한 번역 결과를 내놓게 되는 거랍니다.”
김 리더는 번역 기술을 ‘그림 그리기’에 비유했다. “번역기가 문장을 보고 그림을 그린다고 생각하면 됩니다. 쉬운 문장은 바로 알아볼 수 있게 간단하게 그리고, 복잡한 문장은 매우 섬세한 정밀화처럼 그리는 거죠. 번역 결과를 내는 과정은 반대 순서로 이뤄집니다. 완성된 그림을 보고 다른 언어로 다시 풀어내는 거죠. 이 그림을 그리는 과정에서 스스로 학습하는 인공지능 기술이 쓰이는 겁니다.”
번역 프로그램은 작동 기술만큼이나 데이터베이스(DB)가 중요하다. 학습량이 많을수록 똑똑해지는 것과 같은 원리다. 학습 데이터는 사전에 실린 단어와 예시문을 비롯해 기사, 논문, 특허문서, 매뉴얼, 일상 언어 등 다양하다. 이 때문에 번역 품질을 높이기 위해서는 다양한 분야의 데이터를 최대한 많이 쌓아야 한다.