ほぼテク8月5日最新情報アップデート!Metaの生成AI「AudioCraft」とGPTのコラボレーション?

ほぼテク読者の皆様、いつも大変ありがとうございます!
我妻裕太です。

本日もよろしくお願いいたします。GPTに関する連続投稿約103日目です!
本日は最新情報アップデートです。

Metaの生成AI「AudioCraft」がオープンソース化されました!

今日はエキサイティングなニュースをお届けします!

AI技術の進化により、以前は夢だったようなことが現実のものとなっています。
その最新の一例として、音声生成AI「AudioCraft」のオープンソース化をご紹介します。

AudioCraftとは、ユーザーがテキスト入力を行うことで、高品質で現実的なオーディオや音楽を生成するシンプルなフレームワークです。
これにより、例えばプロのミュージシャンが楽器を一つも演奏することなく新しい作品を探求したり、インディーゲーム開発者が限られた予算で仮想世界に現実的なサウンドエフェクトや環境音を追加したり、小さなビジネスオーナーが最新のInstagram投稿に簡単にサウンドトラックを追加したりすることが可能になります。

AudioCraftは三つのモデル、MusicGen、AudioGen、そしてEnCodecから成り立っています。
MusicGenは、テキストベースのユーザー入力から音楽を生成するために、Metaが所有する特定の音楽で訓練されました。

一方、公共の効果音で訓練されたAudioGenは、テキストベースのユーザー入力からオーディオを生成します。
これにより、犬の吠え声や車のクラクション、木の床に落ちる足音などの環境音や効果音を生成することが可能になります。

これらのモデルは研究目的で公開され、技術の理解を深めるため、また、研究者や実践者が自身のデータセットで初めてモデルを訓練し、技術の進歩に貢献できるようにするためです。

以下はMetaの紹介ページの日本語翻訳・要約文章です。

【要約】
AudioCraftは、プロのミュージシャン、インディーゲーム開発者、ビジネスオーナーなどが、自身のテキスト入力に基づき高品質な音楽やオーディオを生成できるシンプルなフレームワークです。このシステムはMusicGen、AudioGen、EnCodecの3つのモデルで構成されています。それぞれのモデルは特定の目的のために訓練されており、例えば犬の吠える音や車のクラクションなどのサウンドエフェクトを生成することができます。今回、これらのモデルが研究目的で公開され、研究者や実践者が自分のデータセットを用いてモデルを訓練し、技術を理解深めることが可能となりました。

詳しくはこちらの原文をご覧ください。

ではさっそくやってみよう!もちろんGPTで・・・

さぁ、ここで出てくるのが大好きChatGPTです。
今回は「AudioCraft」に投入するプロンプトを生成してみたいと思います。

プロンプトは以下のとおりです。

【プロンプト】
あなたは優秀な音楽家です。
MusicGenと呼ばれるプロンプトから音楽を生成するAIのサービスがあります。
MusicGenに投入するプロンプトを書いてくれますか?
生まれてきたよかったと思えるワクワクするようなメロディーがいいです。
英語と日本語それぞれ生成てしてください。

プロンプトのサンプルは以下のようなイメージです。
Text Prompt: Earthy tones, environmentally conscious, ukulele-infused, harmonic, breezy, easygoing, organic instrumentation, gentle grooves

結果は以下のとおりです。

もちろんです。以下に英語と日本語それぞれでプロンプトを生成しました。

【English】

Text Prompt: "A melody that evokes the thrill of being alive, resonating with the joy of existence. Infuse it with a sense of exuberance, heart-swelling gratitude, and the uplifting spirit of a life worth living. Think vibrant, optimistic tonalities, buoyant rhythms, and harmonies that bloom like a smile."

【日本語】

テキストプロンプト:「生きている喜びを感じさせ、存在の幸せに共鳴するメロディーを作り出してください。それには、豊かな喜び、心が満たされる感謝、そして生きる価値のある生活の高揚感を込めてください。考えるべきは、明るく楽観的な音色、弾けるようなリズム、そして笑顔のように開花するハーモニーです。」


おぉ、すごいな!このリクエストでここまで書いてくれるんですね!素晴らしいです。
以下の文章などは私からは出てこなそうな表現ですね、また一つ学びとナレッジが増えたな(笑)

そして生きる価値のある生活の高揚感を込めてください。

では、この文章をもとに「AudioCraft」に投入してみよう!

「AudioCraft」で音楽を生成する!

「AudioCraft」をPCで動かそうとするとGPUが必要な感じでしたので、PCの選択肢はやめて、Hugging Faceに助けてもらうことにしました!
Google Colaboratoryでも実行可能かと思います。

Hugging FaceのURLはこちらです!

こちらが画面のイメージです。

では早速プロンプトを入力して生成してみよう!
生成している様子はこちらです。音楽が生成できるまで今回は約3分でした。カップラーメンと同じですね(笑)
以下の動画は約3分間なにも変わらないので、終盤の方をご覧ください(笑)


こちらがAIで生成した音楽です!

おぉ!おぉーーーー、なんだかAIが生成したと思うだけでドキドキするな(笑)
なんかちょっと変な感じに聞こえますけど、とても幻想的な感じですね。

これがAIが考える「生きている喜び、高揚感」などなのでしょうか。なるほど。
深いな・・・

まとめ

っということでいかがでしたでしょうか。

本日はGPT-4で生成したプロンプトと、そのプロンプトで音楽を生成してみました!
生成AI同士の素晴らしい競演です!

もう音声生成AIの可能性が楽しみでなりません。


このAudioCraftは、今後のクリエイティブな音楽制作やオーディオコンテンツ制作において、かなり貢献すると思います!
私たちがこれまで体験したことのない新しい形の音楽体験が期待できますね。

オープンソース化されたAudioCraftを使って何ができるのか、どのような創造力が生まれるのか、今から楽しみですね。
皆さんもこの興奮を共有してください。次回もAIの最新情報をお届けしますので、ぜひお楽しみに。

今回の記事がみなさまの何かの参考になりましたら幸いです。
今回も最後までお読みいただきありがとうございました。

また次回お会いしましょう。

原稿執筆

株式会社GROWTH JAPAN TECHNOLOGIES  我妻裕太

バックナンバー

ほぼテク8月4日動画の字幕をGPTと一緒にクリエイティブしてみました!

ほぼテク8月3日連続投稿100日記念!「ほぼテク」の究極のチートシート?を公開します!

ほぼテク8月2日GPTのライバルになるか?満を持して登場のIBMのwatsonxで日本語が得意か実験してみました!

ほぼテク8月1日GPTのライバルになるか?満を持して登場のMetaのLlama2で日本語が得意か実験してみました!

ほぼテク 7月31日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!地元宮城県はどこまで計画してくれるか試してみた編!?

ほぼテク7月30日GPT-4のCode Interpreterで気象分析にチャレンジしてみた!?

ほぼテク7月29日GPT-4のCode Interpreterで身体を引き締める?ChatGPTをパーソナルトレーナーにする方法!?

ほぼテク 7月28日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!くせになって国内でも旅行計画GPT-4の福岡編!

ほぼテク 7月27日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!GPT-4のロンドン編!

ほぼテク7月26日ソフトウェア開発におけるSQL作成の課題をChatGPTが解決!?人間とAIで開発する次世代のソフトウェア開発!?

ほぼテク 7月25日ChatGPTで夏真っ盛り!夏の行楽シーズンの旅行計画をChatGPTと考えてみた!GPT-3.5のロンドン編!

ほぼテク 7月24日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?研究者ネットワーク編!

ほぼテク7月23日ChatGPTが変える業務効率化!ChatGPTを使った次世代のタスク管理!?

ほぼテク7月22日ChatGPTをあなた専用のAIにカスタマイズ!新機能「Custom Instructions」の紹介です!

ほぼテク 7月21日GPTのライバルになるか?ついに登場IBM WatsonからLLMが登場!その名もwatsonx!

ほぼテク 7月20日GPTと創る新しいビジネス体験の世界へ!Bing Chat EnterpriseとMicrosoft 365 Copilotの進化!

ほぼテク7月19日GPTのライバルになるか?満を持して登場のMetaのLlama2が先ほど公開されました!

ほぼテク 7月18日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?論文から引用解析編!

ほぼテク7月17日海の日にちなんで?多様化するDBの波を乗り越えられるかをChatGPTで試してみました。

ほぼテク7月16日GPT-3.5、GoogleBardでシフト管理を考えてみました!

ほぼテク7月15日GPT-4 Code InterpreterでG20の人口成長率を分析してみたら新しい気づきをくれました!

ほぼテク 7月14日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?論文から専門用語と概念抽出!

ほぼテク 7月13日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?論文メタデータ編!

ほぼテク7月12日最新情報アップデート!GPT-4一般公開されたけど、APIで支払い履歴がないと使えないことが分かりましたの件(涙)

ほぼテク 7月11日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?レシピ開発編!

ほぼテク 7月10日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?スケジュール管理編!

ほぼテク7月9日最新機能ChatGPTの「Code Interpreter(コードインタープリター)」を使ってみました!

ほぼテク7月8日SaaSサービスの利用規約のひな型をGPT、Bardで作ってみました!

ほぼテク 7月7日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?マーケット調査編!

ほぼテク 7月6日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?契約書編!

ほぼテク7月5日BingのGPTの画像認識を解剖?ChatGPTとの違いと画像解析の可能性を探る!

ほぼテク 7月4日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?ニュース記事の分析編!

ほぼテク 7月3日ChatGPTで「文章の中の大事な単語を拾いだす」テキストデータから宝を見つける究極のガイド?カスタマーサービス編!

ほぼテク7月2日ChatGPT・GoogleBardを活用したコンテンツモデレーション(投稿監視)!コミュニティの健全性と品質をChatGPT、GoogleBardで保てるか?

ほぼテク7月1日ChatGPTを活用してオンラインショッピングサイトのカスタマーサポートを効率化しよう?

ほぼテク 6月30日ChatGPTと固有表現抽出!テキストデータから宝を見つける究極のガイド?SNSマーケティング編!

ほぼテク 6月29日 ChatGPTと固有表現抽出!テキストデータから宝を見つける究極のガイド?

ほぼテク6月28日AIと一緒にダイエット?ChatGPT、GoogleBardに体重データを分析してもらった!なかなか面白いよ(笑)

ほぼテク 6月27日GPT活用で時短!議事録作成の革新的な効率化テクニック②GPT、Bardで議事録作成!

ほぼテク 6月26日 GPT活用で時短!議事録作成の革新的な効率化テクニック①GPTによる架空の議事録生成実験!

ほぼテク6月25日GPTの最新機能!「Azure OpenAI Service on your data」を試してみました!

ほぼテク6月24日GPTの活用事例!チャットボット用のQAデータをGPTで作成してみた!

ほぼテク 6月23日 GPTはメールの緊急度はチェックできるのか実験をしました!

ほぼテク 6月22日 GPTと自社データをシームレスに結びつける新サービス「Azure OpenAI Service On Your Data」公開プレビュー!を徹底解説!

ほぼテク6月21日GPT4の活用事例!生成AI達でAIの教師データを生成してみよう。

ほぼテク 6月20日メールをチェックするのはあなたとChatGPT!

ほぼテク 6月19日ChatGPTのリアル活用事例を参考にシステム開発の目線で仕組みを考えてみました!

ほぼテク6月18日最新情報アップデート!AIとの会話で進化する車の運用― メルセデス・ベンツのChatGPTの試験搭載について

ほぼテク6月17日ChatGPTの活用ガイド!AIをあなたのプロジェクトに取り入れる方法徹底解説?

ほぼテク 6月16日 GPT-4!テクノロジーの進化と新たな可能性

ほぼテク 6月15日ChatGPTがさらにパワーアップ!新モデルと機能のリリース情報?

ほぼテク6月14日!ChatGPTを活用するために重要な留意事項13選! AIとのスムーズな対話を実現!

ほぼテク 6月13日大好きChatGPT!全知全能の神様ではない、その真実に迫る?

ほぼテク6月12日ChatGPTの言語理解力を革新する「大規模言語モデル」を徹底解説?

ほぼテク6月11日!ChatGPTでSNSマーケティングを攻略しよう!

ほぼテク6月10日!ChatGPTで情報の抽出をマスターしよう!

ほぼテク 6月9日AIを活用した業務効率化!ChatGPTでのタスク管理と優先順位付け?

ほぼテク 6月8日AIとメールの融合?ChatGPTを活用したメール作成術!

ほぼテク6月7日!ChatGPTを使って業務効率化! - データ解析とレポート作成の新たな方法?

ほぼテク 6月6日 AIと英語学習の融合?ChatGPTの有効活用法!

ほぼテク6月5日!ChatGPTで金融業でのAI活用?クライアント情報の間違いを探し出す

ほぼテク6月4日!ChatGPTでマスタ情報を活用した間違い探し!

ほぼテク6月3日!ChatGPTで文法・スペルチェック!

ほぼテク 6月2日 AIの進化とレシピ生成の競争:ChatGPT「GPT-3.5」対「GPT-4」対Google Bard

ほぼテク 6月1日新3大AI!ChatGPT or Google Bard比較パート⑥(一番上手そうなレシピを生成してくれるのはどれか?Google Bard編)

ほぼテク5月31日!ChatGPTでファンタジーは創造できるか?

ほぼテク 5月30日新3大AI!ChatGPT or Google Bard比較パート⑤(一番上手そうなレシピを生成してくれるのはどれか?GPT-4編)

ほぼテク 5月29日 新3大AI!ChatGPT or Google Bard比較パート④(一番上手そうなレシピを生成してくれるのはどれか?GPT-3.5編)

ほぼテク5月28日!ChatGPTで地元仙台市を分析してみました!

ほぼテク5月27日!ChatGPTでWebサイトから重要な情報を取得できるか試してみました!

ほぼテク5月26日 新3大AI!ChatGPT or Google Bard比較パート③(だれが回答を出す際の音速の貴公子か?)

ほぼテク5月25日 ChatGPT or Google Bard比較パート②(生成AIに最新情報は取得できるか)

ほぼテク5月24日!ChatGPTプラグイン実践編!画像生成のためのプロンプト生成プラグイン!

ほぼテク 5月23日(ChatGPT or Google Bard) – テクノロジーが日常にもたらすイノベーション?

ほぼテク 5月22日(ChatGPTを自社Webサイトに組み込むには? ) – テクノロジーが日常にもたらすイノベーション?

ほぼテク5月21日!ChatGPTプラグイン実践編!食べログプラグイン!

ほぼテク5月20日!とても面白いChatGPTのプラグイン使ってみました!

ほぼテク 5月19日(ChatGPTを自社システム・自社サービスに組み込むには? ) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 5月18日(SRA東北版ChatGPT誕生しました? ) – テクノロジーが日常にもたらすイノベーション?

ほぼテク5月17日!GPTとの冒険!ファインチューニングで試行錯誤、そして成功へ!

今更聞ける!ほぼ毎日テック日報 5月16日(ChatGPT? OR SRA東北?まとめ ) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 5月15日(ChatGPTと過ごした3日間?AI・人工知能EXPO出展報告、ChatGPT対応ソリューション多数ございます!) – テクノロジーが日常にもたらすイノベーション?

ほぼテク5月14日!ChatGPT Webブラウジング機能がリリースされました!

ほぼテク5月13日!ChatGPTを活用した創作活動の一例!物語のプロットを創ってみた。

ほぼテク5月12日!Bard – Googleの新しい会話型AIが世界デビュー!

今更聞ける!ほぼ毎日テック日報 5月11日(宇宙ビジネスをより注力します!) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 5月10日(ChatGPTとSRA東北の比較?) – テクノロジーが日常にもたらすイノベーション?

ほぼテク5月10日!今、私たちは新たなフロンティア、つまり宇宙へと視野を広げています!

今更聞ける!ほぼ毎日テック日報 5月9日(特定型AI(Narrow AI)とは) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 5月8日(日本最大級のイベントAI・人工知能EXPO) – テクノロジーが日常にもたらすイノベーション?

ほぼテク5月7日!Chat GPTの正しい使い方基本プロンプトで会話してみました④

ほぼテク5月6日!Chat GPTの正しい使い方基本プロンプトで会話してみました③

ほぼテク5月5日!Chat GPTの正しい使い方基本プロンプトで会話してみました②

ほぼテク5月4日!Chat GPTの正しい使い方基本プロンプトで会話してみました①

ほぼテク5月3日ImageCreatorで生成した画像で展示会?

今更聞ける!ほぼ毎日テック日報 5月2日(スケール則(scaling law):極めて重要な法則) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 5月1日(ChatGPT? OR SRA東北?) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報(おとなの週末) 4月30日(マイクロソフト画像生成AI「Bing Image Crator」とは?) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報(おとなの週末) 4月29日(完全自動実行AI AutoGPTとは?) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 4月28日(ChatGPT? OR SRA東北?) – テクノロジーが日常にもたらすイノベーション?

今更聞ける!ほぼ毎日テック日報 4月27日(ChatGPT? OR SRA東北?) – テクノロジーが日常にもたらすイノベーション?

新企画!?「今更聞ける!ほぼ毎日テック日報 - テクノロジーが日常にもたらすイノベーション?」

前へ
前へ

ほぼテク8月6日GPTの力で未来を予測!?GPT-4が時系列分析モデルARIMAを構築!

次へ
次へ

ほぼテク8月4日動画の字幕をGPTと一緒にクリエイティブしてみました!