「例えば『こんな時にお越しいただきありがとうございます』というテキストを翻訳する際、原文以外にも『昼間に大雨が降った』という情報があったとします。すると『こんな時』を『お足元の悪い中』と訳すこともできるようになる。そのためには原文の情報だけではなくて、天気の情報も学んでおいて組み合わせる必要がありますよね。そこにさらに、匂いの情報や時代の情報など、さまざまな様式の情報を加味するようになると、さらに翻訳の精度が上がっていきます。
ただ、AIに学習させるためにはデータが必要で、原文と訳文だけでなく『これは誰が書いたのか』『その人はどんな人物なのか』等々、大量のデータを紐づけていかなければならない。それを人間が手作業でやるとなると非常に大変です。部分的には自動的にデータを紐づける仕組みもあり、その作業はここ1~2年で一気にレベルが上がっていくとも思うんですが、例えば、シェイクスピアのテキストを入力した際に、シェイクスピアの人物像や歴史、時代状況、その他のさまざまな文脈を全て踏まえて訳出できるようになるまでには、まだまだ時間がかかりそうだと感じています」(山田教授)
機械翻訳が今後も発展を続ける一方で、それを使う側の“翻訳スキル”の重要性も増していくことになりそうだ。
◆取材・文/細田成嗣(HEW)