Google翻訳に関する注意
これまで、Google翻訳(GNMT)の優秀さについて書いてきましたが、もちろん、GNMTは、現段階では完璧なものではありません。日英/英日について実験を繰り返してみると、明らかな誤訳も頻繁に見つかります。意味が逆になってしまったり、原文にない情報が訳文に出現するなど、不思...
AIと原稿
「言語の冗長性とAI」の稿で、日本語は、AIにとって解釈しやすい言語だと書きました。もちろん、AIにとって解釈しやすい日本語は、正しく簡潔に書かれている場合に限られます。書き手の癖が強かったり、「てにをは」が拙かったりすると、AIの誤読も当然多くなります。 ...
言語の冗長性とAI
「中間言語」の稿で書きましたように、Google翻訳(GNMT)は、中間言語を使用して翻訳を行っているようです。したがって、GNMTの翻訳は、原文を解釈する解釈段階と、訳文を生成する生成段階の2段階の作業を行っていると想像されます。したがって、GNMTの誤訳は、解釈段階のエ...
言語の冗長性
日本語や英語などの自然言語は、それぞれ異なるレベルの冗長性を有していると考えられます。例えば、日本語の場合、口語では、「明日、東京行く?」や「今日、何食べる?」のように、助詞やその他の文法的要素が省略されることが多いです。これを丁寧な文章語にすると、「あなたは、明日、東京に...