教師の質
- ito017
- 2017年1月14日
- 読了時間: 2分
Google翻訳は、特に特許明細書の日英翻訳に関して優秀ですが、独日、中日などで試してみると、未だ問題が多いように感じます。ウェブサイトや広告的な文章などは、従来型の機械翻訳と変わらないような不自然な訳も現れ、同じ「人?」が訳したとは思えないような状況です。 中間言語など、斬新な概念が導入されてはいるようですが、現段階のGoogle翻訳は、理想的な人工知能に近付きつつある巨大な翻訳メモリと考えた方が妥当かもしれません。 日英特許翻訳の分野では、日本人翻訳者たちが真面目に頑張ってきたお陰で、優れた対訳データベースが存在しています。優れた教師が良い手本を見せれば、生徒の学習は進みます。 一方、WEBの世界では、適当な機械翻訳の出力をそのまま貼り付けて、多言語対応の体裁を整えているだけのサイトも多数あります。適当なことを教える出鱈目な教師が大勢いるような状況です。これでは、生徒の成績が良くなりません。 人間の子供も、口の悪い大人の真似をすることはありますが、それが悪いことだと分かっている場合が殆どのようです。機械は善悪の区別なく、何でも鵜呑みにしてしまいますから、そこが問題なのでしょう。 将棋や囲碁など、最終的に勝敗がはっきりするゲームでは、好手・悪手の判定も付けやすいと思われます。翻訳の世界では、どのような翻訳が良い翻訳なのかについては、翻訳者の間でも意見が分かれることが多いです。しかし、明らかに駄目な翻訳については、ほぼ満場一致で駄目と判定されます。何らかの判定材料で駄目そうな対訳を検出し、このような対訳は学習しない、というようなアルゴリズムが実現すれば、Google翻訳はもっと賢くなるような気がします。
最新記事
すべて表示「人口知能の進化」、「塩化ナトリム」、「100%の確立」など、故意に誤字や脱字を含ませたテキストを自動翻訳に入力してみますと、面白い結果が得られました。 Google(AI)およびMicrosoft(AI)の翻訳サービスは、「人口知能」→「人工知能」、「ナトリム」→「ナ...
Google翻訳(GNMT)を検証する際、自分が以前に携わった案件でGNMTを試してもあまり意味がありません。GNMTは、過去の対訳データベースから翻訳を学習しているようなので、過去の原稿を読ませると、以前に自分が提出した翻訳文が返ってくる可能性があります。「なかなか上手く...
Google翻訳(GNMT)に関して最も悩ましい問題は、守秘義務の問題です。GNMTに原稿を読ませると、原稿は、Google社のデータベースに組み込まれると考えられます。発明報告書や出願前の明細書の原稿をGNMTに読ませた時点で、発明が直ちに公知になる(新規性を喪失する)と...