中でも翻訳精度の高さで評判なのがDeepL翻訳だ。ドイツ・ケルンを拠点とする会社が開発したサービスで、リリースは2017年。その後、2020年3月に日本語にも対応するようになると、その使い勝手の良さから多くの利用者から注目を集めるようになっていった。DeepL翻訳の特徴について、山田教授はこう指摘する。
「Google翻訳やみらい翻訳と異なり、DeepL翻訳は内部の仕組みを説明した学術的な論文を出していないので、本当のところはわかりません。なのであくまでも憶測となりますが、次のように考えられると思います。
まず、最も大きいのは『データの質が良い』ということ。AIの深層学習を利用する際には、必ず原文と訳文のデータが必要になりますよね。その中から色々なパターンを見つけて学習していきます。この点でGoogle翻訳では、他社よりも桁違いに多いデータ量を保持していたことが最初はアドバンテージになったんですが、徐々にどうも質の悪いデータが多いということがわかってきた。
一方、DeepL翻訳の会社では、もともとウェブ上で原文と訳文を探してくる装置を持っていて、医療や機械工学などさまざまな分野に特化した対訳のデータベースを持っていたんです。それでプロの翻訳者向けに、翻訳する際の参考として使えるLingueeというサイトを運営していたんですね。その良質なコーパス(対訳データ)をベースに機械学習させて、医療用や機械工学用など専用の翻訳エンジンを作っていきました。
DeepL翻訳の裏側は一つではなくて、どうも専用の翻訳エンジンが複数あるようです。それで、例えば医療の分野のテクストを入力すると、『この単語の並びは医療っぽいな』と判定して、医療専用の機械翻訳に送るようになっているらしい。なのでGoogle翻訳などの一般知識しか持たない機械翻訳よりも、良質なコーパスで鍛えられた専用の翻訳エンジンがたくさん揃っているDeepL翻訳のほうが、精度が高いと言われています」
もちろん、現時点ではまだ機械翻訳は万能ではない。DeepL翻訳も、長文を訳出しようとすると途中の一文を丸ごと削除してしまうことがあり、注意が必要だ。飛躍的に精度が向上したとはいえ、当面の間は機械翻訳を利用する際に、あくまでも人間の手作業でのチェックが必要だろう。
◆取材・文/細田成嗣(HEW)