魔法と呪文
2023年も残り僅かとなりました。今年は、生成AI(Generative AI)が大いに注目された年でした。特に、ChatGPTをはじめとするテキスト生成AIの目覚ましい進歩は、我々の仕事にも影響を与えそうなので、既に色々お試しになっている方も多いかと思います。
翻訳や特許業務に関連しそうなAIサービスについては、既に多くの弁理士、翻訳者が様々な検討をされているようですので、今回は、敢えて、テキスト関連のAIではなく、画像生成AIについて書きます。
私も興味本位で幾つかの画像生成AIで遊んでみました。確かに、機械が書いたとは思えない美しい絵が数秒で完成するのには感動します。まさに、「十分に発達した科学技術は、魔法と見分けがつかない(Any sufficiently advanced technology is indistinguishable from magic)」を実感します。しかし、しばらく遊んでいるうちに、AIに思い通りの絵を描かせることは、思いのほか難しいこともわかります。
AIに画像を生成させるには、ユーザは、promptと呼ばれるテキスト(多くの場合、英語)を打ち込む必要があります。そのテキストに応じた画像をAIが生成する、というわけです。このpromptに打ち込まれるテキストは、「呪文」と呼ばれています。思い通りの絵をAIに描かせるには、この呪文を上手く操る必要があるわけです。
例えば、「長靴を履いた猫」という呪文では、AIは上手く絵を描けない。そこで、「二足歩行の人間のように擬人化された猫。中世ヨーロッパの貴族のような衣装を着ている。ハットを被っている。ロングブーツを履いている」などと呪文を変更してみると、私が想像する「長靴を履いた猫」らしい絵が現れる。一次元の言語情報で二次元の画像を生成し三次元の世界を表現するという作業は、特許明細書の作成作業に似ている部分もあると思います。
プロンプトでは、「{長靴},((ハット))」などの特別な文法を使って強調させたい要素を指定することもできる。逆に、「ネガティブプロンプト」を使用して、画像内に現れて欲しくない要素を指定することもできる。このように、AIによる画像生成という魔法を上手く使いこなすために、私たちは呪文を習得する必要があるようです。
数年後には、音楽、映像、テキストなどの様々なクリエイティブな分野で、高度な魔法を取得した魔法使いが活躍するようになっているかもしれません。
*もちろん、生成AIには著作権侵害や秘密漏洩などの様々な課題があります。
Commentaires