今回は画像生成AIがテーマです。僕もそうですがこのブログの読者のみなさんにとっても専門外の話だと思いますのでリラックスしてお楽しみ下さい。なぜ音楽ブログがこんなテーマを取り上げるのか?ですが結論からいうと「説明的なイラスト」をイメージ通りに描いてもらえるようになったから、です。アイキャッチとしてのカバーガール的なものはこれまでもAIでつくられたものをよく見かけました。しかし今回登場のDALL-E 3はたぶん異次元だと思います。この記事ではその片鱗をお見せできればと思います。
この記事でわかること
- イラストのアイディアを考えてもらうところからAI
- DALL-E 3を使うには
- 出来上がりは?
これまでも興味はあったのですが
AI画像生成これまでも面白そうとは思っていたのですが、ハイスペックなPCがなかったため手が出せずにいました。今年はWebサービスがいろいろ出てきたのでどれか試してみたいな~と思っていたところいつもお世話になっているChatGPTのOpenAIの画像生成AIが新しくなったとのこと。さっそく試してみました(無料なので)()。
使い方むずかしいのかな?とおもっていたら
そんなことはありませんでした。DALL-E 3単体で使うのではなくBing Image CreatorのWebサービスとして使うということなんですね。使い方も Edgeのブラウザからプロンプトを入れて生成ボタンを押すだけなのでめちゃめちゃ簡単。しかも無料の範囲でイメージ通りになるまでたくさん出力できます。同じプロンプトでも何度か生成してみてはじめてイメージ通りのものが出るのがAI画像生成なので、よくある数回で課金を求められるパターンだと試すことすらできません。今回のDALL-E 3に関してはそうしたストレスとは無縁で存分に使うことができます。
イラストのプランをつくるところからAI
タイトルのとおり今回は「成功したアマチュアミュージシャン」の姿を描きます。しかし僕は絵のことは何も知りません。そこでどんな絵にするのかプランからChat-GPTに考えてもらいました。プランからというのは当然プロンプトまでだからです()。同じ会社のAIですから相性いいだろうなとは想像していたのですが、結果は予想をはるかに上回るものでした。最初アマチュアミュージシャンの成功について聞いたところ20以上も案を出してきたのですが、成功前と後を一枚の絵にしないと一枚絵では伝わらないのでは?というとつぎのようなプランを出してきてくれました。左側が成功前・右側が成功後のイメージです。
ChatGPTの考えたプラン
ChatGPT:おっしゃる通りですね。成功前と成功後の対比は、視覚的にストーリーを伝え、読者に深い共感やインスピレーションを与える力があります。以下に、そのアイディアに基づいたイラストのコンセプトをいくつかご提案いたします。
1. 孤独な練習とステージパフォーマンス:
- 左側: 部屋の一隅で一人で練習しているミュージシャンの姿。
- 右側: 輝かしいライトと大勢の観客の前でパフォーマンスしているミュージシャン。
2. 初めての作曲とアルバムリリース:
- 左側: ノートパソコンや紙に曲を書いている様子。
- 右側: 完成したアルバムやCDを手に持ち、笑顔でポーズをとるミュージシャン。
3. ストリートパフォーマンスと音楽フェスティバル:
- 左側: 誰もいない通りでストリートパフォーマンスをしているミュージシャン。
- 右側: 音楽フェスティバルのステージで演奏し、観客から拍手をもらっている様子。
4. 自宅録音とプロのレコーディングスタジオ:
- 左側: 簡易な機材で自宅で音楽を録音している様子。
- 右側: プロのレコーディングスタジオで録音しているミュージシャンの姿。
5. 初めての楽曲制作とヒット曲の誕生:
- 左側: 一人でコンピューターや楽譜に向かい、真剣に作曲している様子。
- 右側: ラジオやストリーミングサービスでその曲が流れ、多くの人に愛されている様子。
これすごくないですか?
僕はプロンプトを生成してくださいと入力しただけ。あとは出力を見て自分の言葉で修正ポイントを伝えプロンプトを再生成してもらっただけです。いろいろ不自然なところ、物足りないところはあると思いますが、なにかわかりやすい絵がひとつあればという程度であれば十分に実用になると思います。
DALL-E 3の名誉のために
つけくわえておきますとこれがDALL-E 3の実力ではないと思います。というのは、Bing Image Creatorのプロンプトは300文字程度に制限されているからです。これでは細かい指示を書き込むことはできません。逆に言えば本家がサービス開始したらディティールの詳細はいくらでもChat-GPTで詰めることができるということです。まさに思い通りの表現が可能になりますね。
参考に最後の絵のプロンプトを公開します。これだけざっくりとした指示でイイ感じになるのに驚かされます。ご参考まで。
Create a vertical, photorealistic image with two scenes. Top: A musician composing with a laptop and small keyboard in a dim, cool-toned space. Bottom: A warm-toned setting filled with smartphones displaying the song, surrounded by numerous hearts (❤️) and thumbs-up (👍) symbols, indicating massive popularity and love from listeners. Render in a style resembling a photograph
いかがだったでしょうか
プロンプトを見たら意外にシンプルだったので、僕が知らないだけでほかの画像生成AIでも同じようなことは可能なのかもしれません。でも絵のことは全く知らない自分でも適当に気にいらないところに文句をつけるだけでこれだけの絵ができてしまうんですからChat-GPTとDALL-E 3のopen AIコンビは現在最強と言っていいんじゃないでしょうか(無料ですし())。この内容ならChat-GPTに課金されていない方でもできると思うのでぜひお試しください。ただし商用利用等は制限されていると思うのでご自身で確認をお願いします。それではまた次回のブログでお目にかかりましょう!