魔法と呪文
- ito017
- 2023年12月15日
- 読了時間: 2分
2023年も残り僅かとなりました。今年は、生成AI(Generative AI)が大いに注目された年でした。特に、ChatGPTをはじめとするテキスト生成AIの目覚ましい進歩は、我々の仕事にも影響を与えそうなので、既に色々お試しになっている方も多いかと思います。
翻訳や特許業務に関連しそうなAIサービスについては、既に多くの弁理士、翻訳者が様々な検討をされているようですので、今回は、敢えて、テキスト関連のAIではなく、画像生成AIについて書きます。
私も興味本位で幾つかの画像生成AIで遊んでみました。確かに、機械が書いたとは思えない美しい絵が数秒で完成するのには感動します。まさに、「十分に発達した科学技術は、魔法と見分けがつかない(Any sufficiently advanced technology is indistinguishable from magic)」を実感します。しかし、しばらく遊んでいるうちに、AIに思い通りの絵を描かせることは、思いのほか難しいこともわかります。
AIに画像を生成させるには、ユーザは、promptと呼ばれるテキスト(多くの場合、英語)を打ち込む必要があります。そのテキストに応じた画像をAIが生成する、というわけです。このpromptに打ち込まれるテキストは、「呪文」と呼ばれています。思い通りの絵をAIに描かせるには、この呪文を上手く操る必要があるわけです。
例えば、「長靴を履いた猫」という呪文では、AIは上手く絵を描けない。そこで、「二足歩行の人間のように擬人化された猫。中世ヨーロッパの貴族のような衣装を着ている。ハットを被っている。ロングブーツを履いている」などと呪文を変更してみると、私が想像する「長靴を履いた猫」らしい絵が現れる。一次元の言語情報で二次元の画像を生成し三次元の世界を表現するという作業は、特許明細書の作成作業に似ている部分もあると思います。
プロンプトでは、「{長靴},((ハット))」などの特別な文法を使って強調させたい要素を指定することもできる。逆に、「ネガティブプロンプト」を使用して、画像内に現れて欲しくない要素を指定することもできる。このように、AIによる画像生成という魔法を上手く使いこなすために、私たちは呪文を習得する必要があるようです。
数年後には、音楽、映像、テキストなどの様々なクリエイティブな分野で、高度な魔法を取得した魔法使いが活躍するようになっているかもしれません。
*もちろん、生成AIには著作権侵害や秘密漏洩などの様々な課題があります。
最新記事
すべて表示今回は、翻訳者にとって悩ましい「based on」に関する話です。 原文:システム100は、その情報に基づいて、パラメータを調整する。 訳文:The system 100 adjusts the parameters based on the information....
前回のブログ「明細書の自動作成」で紹介した米国特許US10572600B2号は、「符号がついている名詞に定冠詞をつけない」というフォーマットで書かれています(以下抜粋)。 "FIG. 1 illustrates a system 100 configured for...
二十数年前、特許事務所在籍時代に特許明細書を自動作成できないかと考えたことがあります。アイデアの骨子は以下のような感じです(文章で説明すると長くなるので、大雑把に書きます)。 【入力】 従来の構成=P 発明の特徴=I 効果=E 【出力】...
댓글