このサイトはアフィリエイト広告・Googleアドセンス広告を掲載しています

OpenAIの作曲AI”Jukebox”の衝撃

今話題のChatGPT面白いですね~。コンピュータと会話できる。AI技術が可能にしたこの変革はとても分かりやすくてインパクトがあります。ただChatGPTは文章しか理解しないので曲をきかせてアドバイスをもらうことができません。残念だなと思っていたところ同じ会社ではゼロから曲を作るAI技術の開発が行われていたのでした。今回は作曲AIであるJukeboxについて取り上げてみたいと思います。

この記事でわかること

  • 作曲AIがあります
  • サンプルを聞いてみると
  • 何をめざしているのか?
  • 僕たちの作曲は必要ない?
  • 論文と作曲の違い
  • 僕たちのすべきこと

画像生成AIのすごさ

漫画原作者のRootportさんがAI画像生成ツールMidjourneyで漫画をつくり出版されているという話を知ってすごく面白いと感じました。作品を構成する素材となる絵をコンピュータに描かせている。たしかにストーリーをつくる原作者の立場からすると絵を描くのは人間であってもAIであっても本質的な違いはない。Rootportさんの着想は未来を先取りしていて今後僕たちがAIとどう付き合えばいいのか本質的なヒントくれていると思います。それにしてもそんなことができるのもMidjourneyの作画力があってこそ。興味がわいたので作品を見てみましたがちょっと見ただけでもすごい。絵の心得の無い自分には一生かかっても描けそうもない絵ばかりです。

実は音楽も

振り返って考えてみるとボカロPたちがやっていたのも本質は同じだったように思います。音楽のなかのきわめて重要なパーツである「ボーカル」を初音ミクというアプリをつかってコンピュータで《生成》していたわけですから。また楽曲を構成するその他の音についてもVSTプラグインという「音源アプリ」を使って《生成》していました。ただその方法は1から1000までw「マニピュレート」。人間の声を完コピできる魔術師も実在していましたね。

ところが音楽も

AIが自動で生成する時代になっていたんです。Chat GTPに説明してもらいました。

みつる:オープンエーアイのジュークボックスについておしえてください。

Chat GTP:OpenAI Jukeboxは、OpenAIが開発した音楽生成モデルです。Jukeboxは、指定された音楽スタイルまたはアーティストに基づいて、人工的に演奏された音楽を生成することができます。このモデルは、音楽理論、楽器の演奏法、歌詞生成など、多層の課題を含む高度な人工知能モデルで構築されています。

みつる:開発テーマとして目的の主眼はどのようなところにあるのですか?

Chat GTP:OpenAI Jukeboxの主要な開発テーマは、音楽生成技術を改善し、音楽生成モデルによって生成された音楽をより自然でリアルなものにすることです。このモデルは、人工知能技術を使って音楽生成に必要な高度な知識を学習し、それに基づいて音楽を生成することができるようになっています。これにより、音楽のスタイルやアーティストの選択に応じて自動的に生成された音楽を提供することができます。

みつる:自然でリアルな音楽をつくることが目的なんですね。

Chat GTP:はい、その通りです。OpenAI Jukeboxは、人工知能技術を使って自然でリアルな音楽を生成することを目的として開発されました。このモデルは、音楽理論、楽器の演奏法、歌詞生成など、多層の課題を含む高度な人工知能モデルで構築されています。そのため、生成された音楽は、手作業で作られた音楽と同等の質を有することが期待されています。

みつる:OpenAI Jukeboxそのものは人工知能なので音楽をつくりたいという意思は持っていないと思いますが、人間であるJukeboxの開発チームのみなさんは音楽を人工知能技術でつくりたいという熱い情熱をお持ちになっているんですね。

Chat GTP:はい、開発チームのメンバーたちは音楽生成技術を進化させ、人工知能技術を使って生成された音楽をより自然でリアルなものにすることを目標としています。人工知能技術によって生成された音楽には、新しい音楽スタイルやアプローチが生まれ、音楽の可能性が広がる可能性もあります。開発チームのメンバーたちは、これらの技術を通じて音楽の未来を探求することに熱心であり、音楽生成技術を推進し続けています。

みつる:教えて頂いてありがとうございます。

Chat GTP:どういたしまして。お力になれてうれしいです。ご質問がありましたら、遠慮なくお尋ねください。

サイトはこちらです

表紙ページで音はすぐ聞けます。ご自身の耳でお確かめください。

https://openai.com/blog/jukebox/

画像サイトでいわれていたこと

キーワードは「呪文」と「破綻」だったのですが音楽におきかえてもAIの挙動として実感できます。「破綻」しそうなところをきわどくコントロールしていく。コントロールを象徴しているのがAIに伝える「呪文」です。サイトをつぶさに見てはいないのでわかりませんがそれに相当するものがJukeboxにもありそうですね。

人間が音楽する場合

自分の心臓の鼓動が核になってビートが刻まれますのでどんな演奏でもそれは存在します。上手下手は関係ありません。たぶんそこが人間がやることの意味になってきます。もちろん自分が「演奏して楽しい」というのも重要な要素です。AIの奏でる音楽は音楽的なレベルは驚異的。もちろん僕がボカロP時代につくった楽曲のクオリティなどはるかに超えています。ただ聞いていてそのクオリティに匹敵するようなビート感や感情の流れは感じません。僕にとってはそこが音楽の「自然さ」と感じる部分だということがわかりました。

AIとの役割分担

Rootportさんのように楽曲を構成するパーツをAIにつくってもらう。これは比較的すぐ実現するのではないかと思います。AIと対話しながらアイディアはAIにもらうわけなので僕たちには会話とジャッジする能力が必要。ミュージシャンでもソングライターでもないまさにP(プロデューサー)としての能力ということになります。そしてビートや感情をいかに楽曲にもりこんでいくか?Pにはその手腕が求められますね。知識があれば的確な呪文を唱えてAIにより望ましい結果を出させることも可能になりますからコツコツ研究は続けていきましょう。ロジックだけで完結する論文なら今のAIでも入試に合格できるようです。AIがヒットソングを作れるようになるのも時間の問題かも知れません。しかしそうなったとしても僕たちのやることがなくならないのは音楽のよいところ。Strfが音楽の本質と気づいていてよかった。よろしければこちらの記事もごらんください。

音感がよくなるってめっちゃ楽しい 自分におきた変化の記録(第4回)

それではまた次のブログでおめにかかりましょう!

広告
最新情報をチェックしよう!