健康・美容・賢脳

健康・美容・賢脳に関連したポータルとして、知識や情報、トピックスを提供していきます。

AIがWebの世界を変えていくディープラーニング

 

AI(artificial intelligence)人工知能と言われますが、最近はAI技術によりWebサービスもどんどん変化してきています。

ブラウザを開き、インターネットに接続し、情報を入力したりするとその答えなどが得られるようになってきています。

精度が格段に上がったgoogle機械翻訳

f:id:yakujiman:20191224232153j:plain

例えば、Googleは翻訳サービスにニューラル機械翻訳を導入していますが、そのことで翻訳精度が飛躍的に向上しています。

ざっくりとした意味であれば、Googleの翻訳サービスで素早く大意をくみ取ることができるような時代になっています。 そして、このニューラル機械翻訳に欠かせないのが、ディープラーニングDeep Learning:深層学習)なのです。

機械翻訳の発展

昔の機械翻訳は、RBMT(ルールベース機械翻訳と言われるもので、予め人間が用意した文法ルールと辞書情報を照し合せて訳文をたたき出すという方法になっています。

やがて、コーパスと呼ばれる大量の対訳データをインプットしておいて、それを学習データとして与え学習させていきます。

一つの単語の前後にある単語を含めて翻訳し、組み合わせの確率が高いものが訳文として出されるもので、精度を上げてきました。

そして最近では、ディープラーニングを利用したNMT(ニューラル機械翻訳という方法で、翻訳されるようになってきています。

ニューラル機械翻訳になって、文全体の情報を文脈ととらえることができるようになって、語順や構造が異なる言語間においても高い翻訳精度を出すことができるようになりました。 訳文も自然な文章になってきています。

ただ、原文すべてを正確に翻訳していない可能性もあります。

ざっと大意をつかんで参考にしたいというときにはニューラル機械翻訳は便利ですが、専門的なことや固有名詞や数字の正確性を求められるようなものについては、注意する必要があります。

大阪メトロ堺筋線の訳が、Sakai Muscle Line と誤訳されるというようなこともあります。 ニューラル機械翻訳において、「堺」・「筋」・「線」のそれぞれの単漢字のデータ量が「堺筋線」よりも多かったのでこのような誤訳が起こったと考えられます。

正確さを求めるものであれば、RBMT(ルールベース機械翻訳)を使ったもの、訳文の流暢さを考えるならNMT(ニューラル機械翻訳)と使い分けをしている人もいるようです。

AI発展の肝となるディープラーニング

最近は、文字だけでなく、画像認識や音声認識機械翻訳も含めた自然言語処理などいろいろな分野でAIが活躍するようになりましたが、ディープラーニング(深層学習)はそれに一役かっています。

ティープラーニングは、ニューラルネットワークの計算モデルをもとにした技術になります。 ニューラルネットワークって何?ということですが、これは人間の脳の働きであるニューロンの構造と働きをモデルに作られたAIです。

脳内のニューロンは一定以上の刺激を受けると発火し、つながっている次のニューロンに電気信号を伝えていきます。

そして、ニューロンが発火した場合としなかった場合を数値に置き換え、ニューラルネットワークをいくつもの層に重ねてつくられたのが、ディープラーニングになります。

このディープラーニングの技術は、画像や波形など記号に置き換えられないデータから一定のパターンを認識するのに優れた技術になっています。

つまり、高い精度で画像や音声データの分類や計算処理ができるようになったのです。

このディープラーニングの技術が向上したおかげで、iPhoneのSiri、Googleアンドロイドのグーグルアシスタント、AmazonのAlexaといった音声で応対するAIアシスタント技術も急速に向上してきたのです。

さらに米国では、Googleが、Google Duplex(グーグル・デュプレックス)という、ユーザーの代わりにAIが電話をかけてホテルやレストラン、サロンなどの予約を取ってくれるサービスを発表しています。