特許翻訳とGoogle翻訳
既に公開されている特許明細書をGoogle翻訳(GNMT)に訳させてみますと、かなり優秀であることがわかります。ニュース、ビジネスレター、口語的なネットの書込など、様々なジャンルの文章で日英間の翻訳を試してみますと、GNMTは、特に、特許明細書の翻訳について、優秀な翻訳結果を出力するように感じます。これは、Google Patentなどの特許明細書のデータや、Google Scholarなどの学術論文のデータがビッグデータとして既に存在しているため、所謂ディープラーニングが進んでいる結果だと考えられます。 母国語の文章力は、ある程度、読書量に比例すると考えられます。つまり、母国語の文章力は、文法などの知識ではなく、経験によって獲得されるものだと考えられます。私たち翻訳屋個人が仕事として携わることができる原稿の数は、生涯を通しても数千件の桁であると予想されます。GNMTは、おそらく、その数万倍の文献を読んでいます。現段階で人間の読書量とAIの読書量を比較することは無意味かもしれませんが、AIが人間と同じレベルで内容を理解しながら文を読むことができるようになれば、AIが文章力で人間を上回ることもあり得ると思われます。 公開されている特許明細書について実験を続けた結果、GNMTは、和訳(英→日)より、英訳(日→英)に優れていると感じます。インターネットの世界では、英語のデータが圧倒的に多く、したがって、AIが成長するための「エサ」が豊富であることが、この理由の1つとして考えられます。英訳と和訳で英訳の方が優れているもう1つの理由は、言語の冗長性に関係していると思われますが、これについては、長くなるので、別稿で検討したいと思います。