Site cover image

Site icon imageゴモクマ書跡

面白いものや楽しいものを振り返る

画像生成にハマってる話

Featured image of the post

端的に言ってめっちゃ楽しい。

何故唐突にそんなことを言い出したのかというと、まあ使い始めたからだ。

自分はわりとTRPGをゲームマスター側でよく遊ぶ。
プレイヤーには遊んでいる間、ゲームの世界に没入してほしい。
背景やエネミーの画像でちょっとした視覚的な演出をしたり、BGMで雰囲気を盛り上げたりするのをよくやる。

あくまでも自己満足の範囲だ。
メインのゲームにプラスアルファした要素を、プレイヤーから楽しかった、盛り上がったと言われれば嬉しい。
特にコメントがなかったとしても、まあそういうものだ。
次はもうちょっと工夫してみよう、となる程度。

つまり、非常に力を入れているわけではないが、それなりに労力は使っている、という事柄だ。
プレイヤーたちが最初に訪れる部屋はこんな感じだろうな、というイメージはあり、それにできる限り近い著作権フリーの写真やイラストをひたすらネット検索で探す感じ。
これが現実ベースの世界観のゲームならわりとなんとかなるが、剣と魔法のファンタジーになると一気に難易度が増す。

これを画像生成AIが(ほぼ)一発で解決してしまった。
現状の技術では完璧とはいえないが、「それっぽい雰囲気」の背景なら、画像生成にいくつか案を出してもらうだけでいい感じのものができてしまう。
多少の矛盾や違和感があろうが、ゲーム上で使うだけの架空の背景なら誰も困らない。

あとは、使ってみると意外なことに気づいた。
頭の中のイメージを伝える時に、言語化を忘れる部分が必ずある。ということに。

AIに生成の命令を出すとき、当然ながら、命令文の中には描写されるべきものが入っていないといけない。
にもかかわらず、「雰囲気」を伝えただけで、我々は「存在している(あるいは存在しないことが)当然のもの」を想像している。

これは自分がハイコンテクストな日本語ベースで物事を考えているからかもしれないが、面白い発見だと思った。

例えば、自分はこの間、GoogleのAIであるGeminiを使ってホラーゲーム用の背景をいくつか生成した。
欲しかったのは廃校の図書室。蔵書は片づけられて、汚れた本棚ばかりが残っている廃墟のような感じだ。

最初のプロンプトとしてはこんな感じ。

A school library.The floor is dirty.
Geminiは現状、日本語に対応しているものの、画像生成は英語じゃないとしてくれない

出てきたうちの一例がこちら。

Image in a image block

なんていうか、普通にきれいな図書室が出てきてしまった(笑)

さて、最初に自分が思ったのは「明るすぎる、昼間じゃない」「床が汚くない」「本がたくさん残ってる」あたりだろうか。
自分がAIにつけたこの文句のうちふたつは、プロンプトにない。
命令していないのだから、描写されていなくて当たり前だ。

「汚くない」というのも、判断が分かれるところ。
フロアそのものが薄汚れているのか、ゴミで散らかっているのか。
プロンプトで明確にしていないからだ。
Geminiが同時に出してくれた別案では、丸めた紙ゴミがちらかっていたので「汚い」というニーズは満たしていた。
しかし、自分が想像していたのは「埃っぽい、放置された」汚さだった。

最終的にプロンプトを試行錯誤して、それなりに満足いく画像は生成できたのだけれど。

この流れを通じて、「曖昧なイメージを明確に言語化する訓練」ができるんじゃないかと、楽しくなってしまったのだ。
それからは、特に必要もないのに、なんとなく画像があると良さげな雰囲気になりそう、という雑な判断で画像を生成しまくっている。
自分の頭の中のものが、100%の確度でなくとも即座に出てくるのは、なんとも気持ちがいい。
プロンプトの試行錯誤も、ブレインストーミングのようなものと思えば楽しいものだ。

「雑で良い」「正確性はなくていい」というのもポイントだ。
これが仕事やこだわりの趣味のものなら、100%を追求してしまうだろうから、AIによる画像生成は役に立たない、となる。
ひとまずあればいい、雰囲気がつくれればいい、60%~70%を求めるなら、画像生成はもってこいだと思う。

なくても困らないが、あると便利なものが、自分は大好きだ。
しばらく自分はAIと戯れていることだろう。