この度、通義实验室は革新的な音楽生成技術「InspireMusic」を正式にオープンソース化しました。この技術は、音楽、楽曲、音声生成機能を一体化したオープンソースのAIGCツールキットを目指しており、研究者、開発者、音楽愛好家に包括的な創作プラットフォームを提供します。

InspireMusicは、研究者や開発者にとって豊富な音楽/楽曲/音声生成モデルのトレーニングと調整ツールを提供するだけでなく、生成効果を最適化するための高効率なモデルも備えています。同時に、このツールキットは音楽創作の敷居を大幅に下げ、音楽愛好家は簡単なテキスト記述や音声プロンプトで、多様な音楽作品を簡単に生成できるようになりました。

InspireMusicのテキストから音楽を生成するモードは特に注目に値します。様々な音楽ジャンル、感情表現、複雑な音楽構造制御に対応し、ユーザーに大きな創作の自由度と柔軟性を提供します。ユーザーは自分の好みに合わせてテキスト記述を入力することで、自分のニーズに合った音楽作品を生成できます。リラックスしたジャズから、子供心をくすぐるメロディーまで、InspireMusicなら何でも実現可能です。

微信截图_20250211114305.png

さらに、InspireMusicは、fastモデルと高音質モデルを含む柔軟な推論モード設計を備えており、様々なユーザーのニーズに対応します。高速生成を求めるユーザーも、高音質出力を求めるユーザーも、このツールキットで自分に合った創作方法を見つけることができます。

現在、InspireMusicは音楽生成のトレーニングと推論コードをオープンソース化しており、ユーザーはGitHubリポジトリ、ModelScope創空間、HuggingFace Spacesなどのプラットフォームからアクセスして使用できます。

今後、通義实验室はInspireMusicの歌唱生成と音声生成の基本モデルをさらに公開し、より多くの研究者、開発者、ユーザーが積極的に体験と研究開発に参加することを目指しています。皆様のご尽力により、InspireMusicは不断に改善され、音楽創作分野にさらなる驚きをもたらすと信じています。

  • GitHub リポジトリ:InspireMusic(https://github.com/FunAudioLLM/InspireMusic)

  • オンラインデモ:

    ModelScope創空間:https://modelscope.cn/studios/iic/InspireMusic/summary

  • HuggingFace Spaces:https://huggingface.co/spaces/FunAudioLLM/InspireMusic