画像生成AI、「Stable Diffusion」の沼にはまった話
画像生成AI、「Stable Diffusion」
最近、画像生成AIに興味をもち、なにか手軽にできないかと探したところ、「Stable Diffusion Demo」というのを見つけました。
URL https://huggingface.co/spaces/stabilityai/stable-diffusion
このサイトにアクセスすると、2つのプロンプトの入力画面が表示されます。
プロンプトとは、動作の要求を促すもので、生成AIでは、呪文などとも呼ばれています。
プロンプトには2つあり、それぞれ
1.要求を指示するもの(Enter your prompt)
2.要求を否定するもの(Enter a negative prompt)
になります。
現在は、これらの指示を英語で入力する必要があります。
例えば、「オフィスで仕事をするかわいい日本人女性」と言った文章を、翻訳ソフトや翻訳サイトで英語に翻訳して
「Cute Japanese woman working in the office」
の様に入力して、右側の、「Generate image」をクリックすると、入力したプロンプトに従ったものが生成されます。
カワイイかどうかは別として、よく見ると指が6本あったり、手に持っているものが謎だったりと、突っ込みどころのある写真が生成されました。生成された画像で予想外のものが在る場合、もう一つのプロンプト「Enter a negative prompt」へ英語で入力します。
例えば生成された画像の写真に手が3本あるとか、指が6本あるとかだった場合、否定ワードをコンマで区切って指定します。
「3 hands,6 fingers」
顔が変だったり、笑顔にしたかったりした場合は、先ほどの「Cute Japanese woman working in the office」後をコンマで区切って
「Cute Japanese woman working in the office,Smile, draw the face accurately, draw the eyes beautifully, improve the bridge of the nose」
(笑顔,顔を正確に描く,目を綺麗に書く、鼻筋を良くする)
と言ったワードを追加して調整します。
生成AIを調べていると、NSFW(エヌエスエフダブリュー)と言う言葉を目にします。
「NSFWの回避方法」とか、「NSFWにひっかかる」とか
NFSWは、英語のスラングらしく、not safe for work=職場での閲覧禁止と言う言葉の略語らしいです。
生成AIでは卑猥なプロンプトや卑猥な生成画像の事をNFSWと言っています。
基本的にインターネットに公開されている生成AIはNFSWのチェックが入り、関連ワードは入力時点でエラーになったり、生成画像が表示されなかったりします。
一般的にインターネットに公開されているものなので、下手な画像を表示したりしたら、関係当局から指導を受ける事になりますよね
それでもNFSWとわかっていて、あえて使いたい場合もあります。
例えば、風俗産業でビジネスとして画像制作をする場合などの事です。
NFSWを回避する場合、画像生成AIのエンジン自体をローカルPCにインストールする必要があります。
ただし、この場合、要求されるPCのスペックがかなり高く、ハイエンドなゲーミングPCが必要になります。
幸い自分はハイエンドなゲーミングPCを持っているので、ローカルPCへインストールしてみました。
その話は、次回に回したいと思います。



コメント
コメントを投稿