제품 및 서비스정보 기계번역을 통한 특허 및 기술 문서 전문 번역 서비스
주요기술
TRANSFORMER 신경망 구조
Google이 2017년에 발표한 최첨단 신경망 구조
기존 기술과 달리 시퀀스를 순서대로 처리하지 않고, 동일 시간 내에 보다 많은 데이터를 학습할 수 있음
다른 경쟁사들의 RNN 기술보다 향상된 성능

SUBWORD 토큰화
문장을 단어가 아닌 Sub-word 수준으로 분석 (un+friend+ly 또는 집+으로)
학습 단어량을 줄이고 희귀 단어, 미학습 단어에 대응 가능
특히 한국어, 일본어 및 중국어의 번역 성능을 향상시킴

준지도학습
적은 양의 라벨링된 데이터를 사용하여, 학습에 사용될 다량의 데이터를 라벨링
기계 학습을 이용하여 최소한의 인력으로 방대한 양의 학습 데이터를 라벨링
보다 많은 학습 데이터를 확보하여 개선된 번역을 창출

BEAM-SEARCH 디코딩
매 디코딩 단계마다 여러 단어를 한 번에 추적하여 번역 가능한 여러 경우의 수를 생성
가장 “간단한” 문장 대신 가장 “적절한” 문장을 생성
처리 시간이 증가할 수 있으나, 보다 높은 품질의 번역을 생성

컴퓨터 보조 번역 (Computer-Aided Translation, CAT)
기계 번역에 대한 인간 포스트 에디팅을 지원하고 오류 수정 내역을 저장하여 자체 학습하기 위한 툴

품질 예측 (Quality Estimation, QE)
번역 결과에서 단어 및 문장 단위로 사람의 포스트 에디팅이 필요할 가능성을 예측

자동 포스트 에디팅 (Automatic Post-editing, APE)
예문의 수정 내용을 학습하여 자동으로 번역 오류를 교정

홍보브로셔   1. Sales Deck_KAIPS_201009.pdf