昔泣きながらオリ曲用にYouTube動画の映像部分を作っていた自分は衝撃で震えが止まりません()。これはヤバすぎる。1分の実写?!動画がテキストからできちゃう。もう自分でPVできますやん。Open AIのSora。驚愕のハイクオリティはご自身の目でお確かめください。
この記事でわかること
- とにかく映像をみてください。
- これだけできる会社が音楽生成AIを作らないのにはなにか理由があるはず(ぼくの予想)
Soraー今日Google のディスカバリーでおしえてもらいました
Soraと言います。あのChat-GPTのOpen AIの動画生成AIです。Webサイトご紹介します。
Soraのなにがすごいか?
撮影者の感動が凝縮されているように見えること。ま、実際にはそんなひといないわけなんですが()。ちゃんと見ている人の視点や「意図」があります。さらにそこにとどまらず「見る喜び」がシミュレートされている。その結果、AIでつくられたかどうかは関係がない動画ができあがります。経緯を全く知らない人でも、見るに値する動画になっている。理由は視聴者が映像に込められた「見る喜び」を自分でもなぞれるからですね。この調子でいけば延長線上ですぐ視聴者を「感動させる動画」もつくれそうです。
DALL-E3より写真のクオリティは上
実写的な表現については、同じOpen AIのDALL-E3より上。Webサイトをみていただくと、DALL-E3はイラストが主体なことがわかると思います。DALL-E3は概念的なもののイラスト化が得意で伝えたい「コンセプト」を上手に表現してくれます、が写真はそれに比べるとさほどでもありませんでした。
https://openai.com/dall-e-3
こんなすごい動画がつくれる会社ができないはずはない
DALL-E3がフォトリアルな画像を作ることに熱心でないように見える理由は、肖像権・著作権侵害の問題があるからではないでしょうか?顔の特長をAIが集めて再現していくとします。すると、ある程度集まったところでできるのは「本人の顔」以外のなにものでもないですよね()。結局のところ2Dでは特徴の変数が「少なすぎる」のだと思います。ぼくたちは本人そっくりの画像に驚愕するわけですが、AIからしてみたら簡単すぎるのではないでしょうか?
動画ならば被りは回避できる
その点、動画なら次に何が起きるかは様々な展開が考えられます。カメラワークも考慮に入れれば数えきれないほどのバリエーションがあるでしょう。たいして収益が上がらないのに訴訟だらけになりそうな2D画像にくらべれば、無限の可能性がある。そんなわけでOpen AIも本気を出したのではないか?と想像しています。
音楽生成AIを推さない理由(ぼくの予想)
Open AIには音楽生成AIもありますが、華々しく展開しているという感じはないですね。Soraと比べればその差は歴然。理由はずばり「収益性」だと思います。AIからすると音楽は肖像画以上にバリエーションが少ないのではないでしょうか?ちゃんとやろうとするとすぐソックリになって、著作権侵害は避けられません。さらに収益といってももともとはAmazonMusicなど配信サービスユーザーのなけなしの会費が原資。その中のわずかなアーティスト取り分をAIユーザーとわけあうとしたら投資が回収できるはずがありません。動画はきっちりやるから()音楽はAIにたよらないでAudiostockのようなストックサービス利用してねということではないでしょうか。
オリジナルソングをつくりましょう
そんなこんなで新しい曲がつくられなくなったとしても、面白いオリジナルソングの需要がなくなるわけではありません。新曲がないなら過去から掘り起こせ、という訳で動画用に昔の曲が発掘されてきます。
世界的AI企業も間接的にですが「オリジナルソング」つくりは容易だと言っています。Suno AIは違うアプローチで実際に作って見せてくれています。ポップミュージック好きのぼくとしては「オリジナル」の考え方自体にいろいろあると言いたいところです。しかし、敷居が低いこと自体は「自分にもできる」ということですから悪くはありません。似ているようでオリジナルなものを作れるのはコンテクストの中にいる人間だけかもしれません。ひきつづき楽しんでやっていきましょう。