英語力が一番伸びる語学学校

コラム 技術トレンド

AIで外国語の勉強が不要!? AI翻訳の実力は?

人工知能(AI)が得意とする分野のひとつが言語認識。その応用のひとつである翻訳はAIの登場により精度が向上しました。グローバル化が進むなか外国語の需要が高まる一方、日本人の英語力不足などが指摘されています。英語試験TOEFLにおける日本語を母語とする受験者の平均点は120点満点中71点しかありません。AI翻訳がビジネスレベルで実用化されれば、英語力の低さを補うことが可能になります。 

そこで現状におけるAI翻訳の実力と、今後われわれの社会に及ぼす影響力について解説していきます。

参考記事:
【検証】メーカーエンジニアは英語力があれば年収は上がるのか?

 

AI翻訳とは何か

AI翻訳は、広い範疇では機械翻訳や自動翻訳と呼ばれます。コンピューターが自動的にある言語から別の言語に置き換えます。機械翻訳の歴史は古く、1954年にはIBMが機械翻訳の実験を実施したといいます。

ルールベース型翻訳

機械翻訳の始まりは、ルールベース型翻訳です。たとえば「Hello」と「こんにちは」を11対応させれば、それをもとに英語から日本語、あるいは日本語から英語への翻訳が可能になります。単語とともに、各言語の構文規則をシステムに記憶させれば、それに基づき翻訳が可能になります。

Socrates is a human.(ソクラテスは人間だ)のように単純な構文からなる文章であれば、ルールベース翻訳で問題ありません。しかし、巷には文法的に不正確な文章が溢れています。そのためルールベース型翻訳では限界があります。

統計型翻訳(SMT

ルールベース型翻訳の次に登場したのは、統計型翻訳です。単語や句同士の対応関係を数値化し、もっともらしい翻訳を行なうというのが統計型翻訳の骨子です。たとえば「どこですか」という日本語の句に対し、複数の英語の候補が存在します。このような候補の中で、「Where is」との対応関係がもっとも高いと導かれれば、それが英語での対訳になります。 

SMTの研究は長年主流でしたが、論文数の減少など研究が頭打ちになりました。そこでSMTに代わって登場したのが、ニューラル型翻訳です。

ニューラル型翻訳(NMT

ニューラル型翻訳は、AIの進化と切り離せません。ディープラーニング(深層学習)が登場する以前の人工知能は、ルールベースで推論を行なう「エキスパートシステム」が主流でした。エキスパートシステムは第2AIブームをもたらしましたが、暗黙知の扱いが困難なため、その限界が指摘されブームは下火になりました。ルールベース型翻訳でも述べたように、われわれの自然言語処理ははるかに複雑なのです。

 

この暗黙知をうまく扱うのがディープラーニングやその基礎となるニューラルネットワークです。大量のデータを学習して、人間には理解できないような法則性を発見し、その法則に基づいて答えを導き出します。ルールベース型翻訳に取って代わったのが、ニューラル型翻訳です。

ニューラル型翻訳の仕組みはやや複雑です。単語を入力すると、「意味」に相当するベクトルが与えられます。このようなベクトルは別の単語のベクトルとの関係が構造化されているので、「意味」のネットワークが構築されています。このベクトルに基づき、学習によって次に訳出されるべき単語の重要性が、単語毎に確率で表現されます。この表現をもとに、訳出を優先順に行なっていきます。 

統計型翻訳とニューラル型翻訳を比較したとき、ニューラル型翻訳では評価の悪い割合が減る一方、評価が中程度の割合が増加しています。すべての言語間でニューラル型翻訳の評価が向上しているのではありませんが、英語と日本語間での翻訳品質の向上は実際にGoogle翻訳等のサービスを利用した人なら気づくかもしれません。

AI翻訳の実力

AI翻訳の精度を高めたのは、「ディープラーニング」といっても過言ではありません。

高い性能をもつディープラーニング

ディープラーニングの基礎になるニューラルネットワークのアイディアは、ディープラーニング登場以前からありました。しかし登場前後では性能が大きく異なります。基本的なニューラルネットワークは、入力層、中間層、出力層の3層から成り立ちますが、ディープラーニングでは中間層が多層化します。そのため計算量が増大するのですが、近年の計算機の高速化により、ディープラーニングが実用可能になりました。

ディープラーニングを搭載したAI翻訳は、Google翻訳などオンライン公開されていますので、誰でも利用可能です。 

たとえば、英新聞Guradianの記事から文章を抜粋します。

Boris Johnson has been accused by Nicola Sturgeon of intentionally pushing the UK towards a no-deal Brexit, despite his “bluff and bluster” about wanting an agreement with EU leaders.

この文章をGoogle翻訳は

ボリス・ジョンソンは、EU首脳との合意を望んでいることについての「鈍くて鈍い」にもかかわらず、意図的にイギリスをノーディールのBrexitに向けて推進したとして、Nicola Sturgeonによって非難されています。

と日本語に変換します。文法の構造はほぼ対応しています。その一方で、「no-deal Brexit(合意無きブリグジット)」等、背景を知らないと理解できない用語の訳出に難があるともいえます。ニューラル型翻訳の評価が中程度というのも頷けます。

参考記事:
AIと機械学習の関係は?ディープラーニング(深層学習)との違いも解説!

翻訳家が診断するAI翻訳の実力

その一方で、翻訳家からみてAI翻訳の実力をどう診断するのでしょうか。ニューラル型翻訳は「意味」に相当する情報を処理するものの、われわれ人間と違い単語の意味を理解して訳出していません。単語間の関係や訳出語の優先順位等の情報を使って、ある言語から別の言語に置き換えているだけです。

新聞記事の場合には、正しい文法で書かれた文章がほとんどですが、巷には不正確な文法で書かれた文章が溢れていますし、書き手しか知りえないニュアンスを文章に込めることもあります。ニューラル型翻訳は現状このようなニュアンスに対応できないので、翻訳家の実力にはほど遠いと診断されています。

AI翻訳はどう活用されている?

翻訳家並みの実力を発揮できていないにもかかわらず、AI翻訳はすでに社会に浸透しています。スマートフォンのアプリでGoogle翻訳を利用できるなど、わざわざ辞書を持ち歩く必要もありません。そのため、われわれの作業の効率化に貢献できています。

AI通訳機はすでに実用化

AI翻訳だけでなく、音声で通訳可能なAI通訳機も販売されています。ソースネクストは2018年に、63言語に対応した自動通訳端末「ポケトーク」を開発。JR東日本などが導入しています。話しかけるだけで別の言語に翻訳可能で、旅行や国際会議等での使用が期待できます。

Goole翻訳等のAI翻訳と異なり、AI通訳機は発話をテキストに変換する必要があります。テキストに変換後は、先述の仕組みである言語から別言語への翻訳が行なわれます。

AI翻訳を手掛ける日本の研究機関

AI翻訳を手掛けるのは、Googleだけではありません。日本だと情報通信研究機構(NICT)が翻訳開発を手掛けています。日本語の場合、辞書だけでは判別しにくいローカルな情報やニュアンスが適切な訳出の阻害要因になります。そのため、国産の日本語翻訳エンジンの開発が行われています。このエンジンは、先述のポケトークにも導入されているといいます。

国産の日本語関連ソフトが海外に先行する事例はこれまでもみられました。かつて日本語入力システムや日本語用のワープロソフトは、日本で開発されたものがシェアを大きく占めていました。しかし今では、マイクロソフトやGoogleによるソフトが大きくシェアを占めています。日本語には独自性があるとはいえ、AI関連の技術力の高いGoogleやマイクロソフトが日本語翻訳を含めた汎用的な翻訳機で、国産製品を抜くことも十分考えられます。

参考記事:
【徹底解剖!】AIをけん引するGoogleの取り組みとは?

AI翻訳の未来

AI翻訳により、言語変換可能が完璧に行なえるようになる日は来るのでしょうか。来るとすれば、翻訳に携わる職種が淘汰されることも起こりえます。

野村総研とオックスフォード大学による共同研究では、労働者人口の約49パーセントがロボットやAIによって2030年に代替可能という報告が出されています。運転手やレジといった単純作業ではロボットやAIへの代替リスクが高いといわれています。同時通訳や翻訳もAIに取って代わられるのでしょうか。

日進月歩のAI自然言語処理

現状では、完璧な翻訳は難しいとみられています。AIはニュアンスを理解できないというのがその理由です。しかし、ここ1,2年の自然言語処理技術の進化から、完璧に近い翻訳が生まれる可能性は否定できません。 

国立情報学研究所は、東京大学に入学させるAI「東ロボくん」の研究・開発を行ないました。大学入試センター試験の模擬試験で偏差値57.1をはじき出すなど一定の成果を出した東ロボくんでしたが、国語や英語では高得点をとれないことが判明しました。読解力がネックになったのです。そのため、AIで自然言語処理をするのは困難だという結論が下され、東ロボくんの開発は断念されました。

ところが2018年にGoogleが自然言語処理AIBERTを開発し、人間よりも高い読解力をもつことが証明されました。その3ヶ月後にはマイクロソフトが同じく自然言語処理AIMT-DNNを開発し、BERTを上回るパフォーマンスを発揮しました。マイクロソフトは言語分野でのAI活用に力を入れており、AIアシスタントのCortanaやチャットボットの「りんな」を開発するなどしています。

AI自然言語処理の進化スピードの速い背景には、自然言語処理が将来重要な役割を果たすとマイクロソフト等が予想していることが挙げられます。ある言語を別の言語に置き換えることは、コミュニケーションの効率を低下させます。日本でも英語教育などが行われていますが、完璧な翻訳機が存在すれば、外国語教育の必要もなく、別の作業に集中することも可能です。

参考記事:
チャットボットとは?AIとの関係や活用事例を解説

それでも残る翻訳や語学教育の必要性

では通訳や翻訳といった業務が不要になるのでしょうか。BERTなどの最新の自然言語処理AIは文脈を読み取れるなど、言語能力の高さが証明されています。しかし、翻訳は単にある言語から別の言語に置き換える操作ではありません。とりわけ困難なのが文学の翻訳です。作家やその研究者にしかわからない言葉遊びが用いられるなど、文章へのこだわりが深いのが文学の世界。言葉遊び等は言語固有の事象であるため、直訳では全く意味が通じないのです。 

通訳・翻訳等の業務はAIに代替されたり、外国語教育が不要になることは当面ないでしょう。語学に堪能ならば、AI通訳機に頼らないほうがむしろ効率的です。しかしながら、語学が苦手な場合には、効率性を追求してAI翻訳でコミュニケーションを補うことは十分考えられます。

すべての作業がAIに代替されることはありません。自然言語処理はビジネスにも大きな影響力をもつことからGoogleやマイクロソフトといった大企業は研究に莫大な投資を行ないます。その一方で文学の翻訳等はニッチな業種なので、AIの費用対効果は高くありません。AI翻訳が全分野で均等に進化するかは不明です。

可能性を広げるAI翻訳

TOEFLの平均点から示唆されるように、多くの日本人は英語が得意ではありません。これが、グローバル化の阻害要因になりうることが予想されます。AI翻訳の性能は完璧とはいえないものの、年々パフォーマンスは向上しています。人口が減少している日本において、グローバル市場を視野に入れることがますます望まれます。AI翻訳がその一助となることが期待されます。

<参考資料>

BERTとは何か?Googleが誇る最先端技術の仕組みを解説!

Google翻訳より高性能? 「日本の自動翻訳がすごい理由」をNICT隅田氏が解説

「誰もが万能通訳に 驚異のAI音声認識」(『日経コンピュータ』2018年5月24日号)

「機械翻訳の新しいパラダイム」(『情報管理』2017年8月号)

「機械翻訳のいま」(『情報管理』2014年4月号)

「日本語入力に新風が吹き始めた」(『日経パソコン』2010年2月22日号)

「言語の壁がなくなったときあなたは世界で闘えるか」(『中央公論』2016年4月号)

「ジョイスのライバルはシェイクスピアしかいない」(『文芸』1997年5月号)

『エキスパートシステムの開発』(シーエムシー 編著)

『「超」独学法』(野口悠紀雄 著)

『AI時代の勝者と敗者』(トーマス・.ダベンポート、ジュリア・カービー 著)



「無料説明会」を開催中です。

  • この記事を書いた人
  • 最新記事
サウスピーク編集室

Naoki Kitayama

本気留学サウスピークが「フィリピン・セブ島留学 / 英語試験 / 現地生活」に関する情報をお届けします。すべての英語学習者に役立つ情報が盛りだくさんです!

-コラム, 技術トレンド

Copyright© ゼロから実現する海外就職 | フィリピン留学、セブ島留学ならサウスピーク , 2019 All Rights Reserved Powered by AFFINGER5.