2024年07月16日( 火 )

言葉の壁をなくしつつある翻訳テクノロジー(前)

記事を保存する

保存した記事はマイページからいつでも閲覧いただけます。

印刷
お問い合わせ

日韓ビジネスコンサルタント
劉 明鎬 氏

チャット イメージ    旧約聖書の創世記に「バベルの塔」の逸話が登場する。それによると、同じ言葉を使っていたノアの子孫たちは「天まで届くほどの高塔」を建てようと企てた。しかし、この人間の高慢さに対して神は怒った。そして、お互いの言葉が通じ合わないようにしたのだという。その結果、高塔の建設は中止され、人々は各地に散らばっていったとされている。「バベル」はヘブライ語で「混沌」を意味する。

 「バベルの塔」の事件以来、人間はそれぞれ違う言語を使うようになった。現在、世界には約7,000以上の言語が存在しているが、人間はこの言葉の壁をなくすための努力を続けてきた。

 言葉は生命体のように絶え間なく進化を続けている。現在、私たちが日常的に使っている言葉のなかには、文法的に間違っているものも多いが、人間の脳は、それを訂正して理解することができるので、会話が成立する。

 さらに複数の意味をもっている単語の場合、単語を見ただけでは、どういう意味なのかが分からず、文脈のなかで単語の意味を把握しないといけないことも多い。同じ「はな」という発音でも「花」なのか、「鼻」なのかは、文脈で判断する必要がある。また、英語「have」には、30以上の意味がある。同じ単語でも、文章によって、いろいろと違った翻訳となる。だから、翻訳の成果は、多くの研究が為されてきたにも関わらず、微々たるものだったのである。

 しかし、ある瞬間から突然翻訳の品質が飛躍的に向上し、自然な翻訳が可能となった。そのきっかけとなったのが人工知能(AI)の一種であるディープラーニングの適用だ。また、最近のチャットGTPの登場で、言語の壁がついになくなるかもしれないという期待感も抱かせてくれるようになった。

 翻訳の質も今までとは異なり、感心するほど自然な翻訳となった。人工知能を活用した分野のなかで、おそらく機械翻訳は最も成功を収めた分野の1つだろう。

 「機械翻訳」とは、人間が使っている言語をコンピューターが他の言語に翻訳することをいう。最初の機械翻訳は、言語学者が数十年かけて構築した規則を機械に入力して、それをベースにして翻訳させる方法だった。しかし、規則をいくらつくっても、規則に当てはまらない新しい造語などがどんどんでてきて、翻訳の質は、それほど向上しなかった。

 規則ベースの機械翻訳の短所を補完するために登場したのが、文例ベースの機械翻訳であった。人々が実際使っている文例を大量にコンピューターに入力して、翻訳の質を上げようとした試みで、文例とデータを豊富に入力すればするほど、翻訳の質は向上した。しかし、それにも限界があった。

 その後、登場したのがGoogleによる統計ベースの機械翻訳である。この方法では、文章を単語または区、節に分解し、それを翻訳した後、文章に戻す。この方法でかなり翻訳の質が向上したものの、それでも文章を読んでみると、自然ではないケースが多々あった。

 2010年頃には人工知能(AI)、そのなかでもディープラーニングが翻訳に導入された。機械翻訳に人工知能が採用されたことによって、以前のように人間が規則を入力したりする必要はなくなり、人工知能自らが多くの文章データから、規則を学習したり、どれが一番自然な翻訳なのかがわかったりするようになった。

 このような状況下、チャットにリアルタイム多国語対応の翻訳機能を提供して話題になっている企業が、韓国のエニーチャット社だ。現在16カ国の主要言語に対応しており、今後言語数を増やしていくという。

(つづく)

(後)

関連キーワード

関連記事