Adobe、AIツールで歌や音声模倣からオーディオ制作が可能に

AIbase基地

公開日AIニュース · 1 分で読めます · Dec 23, 2024

229

Adobe Researchとノースウェスタン大学が共同開発した画期的なAIシステム「Sketch2Sound」は、簡単な音声模倣とテキスト記述からプロレベルの音響効果を生成できる技術で、サウンドデザイン業界の働き方を根本的に変える可能性を秘めています。

このシステムは、音声入力の3つの主要要素である、ラウドネス（音量）、音色（明るさ）、ピッチ（音高）を分析します。そして、これらの特徴とテキスト記述を組み合わせ、必要な音を生成します。

ビデオ:García 他、Adobe Research

Sketch2Soundの興味深い点は、文脈を理解できることです。例えば、「森の雰囲気」と入力し、短い音を出すと、システムは特別な指示がなくても、その音は鳥の鳴き声であると自動的に認識します。

同じ知能は音楽にも適用されます。ドラムパターンを作成する際、「バスドラム、スネアドラム」と入力し、低音と高音でリズムをハミングすれば、システムは自動的に低音にバスドラム、高音にスネアドラムを配置します。

プロフェッショナルのための精密な制御

研究チームは、生成される音の精度を調整できる特別なフィルタリング技術を組み込んでいます。サウンドデザイナーは、必要に応じて正確で詳細な制御、またはより手軽で近似的な方法を選択できます。

この柔軟性により、Sketch2Soundは、映画やテレビ番組の音響効果を作成するプロフェッショナルであるフォーリーアーティストにとって特に価値があります。物理的なオブジェクトを操作して音を出す必要がなくなり、音声とテキスト記述でより迅速に効果を作成できます。

研究者によると、入力された録音の空間オーディオ特性が、生成される音に望ましくない影響を与える場合がありますが、彼らは現在この問題の解決に取り組んでいます。Adobeは、Sketch2Soundがいつ、あるいは商業製品になるかどうかについてはまだ発表していません。

Sketch2Sound AdobeResearch サウンドデザイン AIシステム

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

OpenAI CEO、AIアートの補償について議論：新たなモデルの必要性を認めるも具体的な計画はなし

最近のTEDインタビューで、OpenAIのCEOであるSam Altman氏は、AIシステムがアーティストの独特のスタイルを使用する場合の補償問題に関して見解を示しましたが、具体的な解決策は提示しませんでした。OpenAIは現在、存命のアーティストのスタイルを模倣した画像の生成を禁止していますが、Altman氏は、将来的にはアーティストが参加を選択し、報酬を得られるようなモデルを採用する可能性を示唆しました。新しいモデルを見つけるのは素晴らしいことだと思います。もしあなたが「このアーティストのスタイルで作品を作りたい」と言い、彼らが参加を選択すれば、それは可能になるでしょう。

Apr 14, 2025

インドのスタートアップZiroh Labs、標準的なデバイスで動作するAIシステムを発表

人工知能技術がますます普及する中、多くの企業は、特に高度な計算チップが必要な場合、高額なハードウェアコストに直面しています。この課題に対処するため、インドの人工知能スタートアップZiroh Labsは、同国のトップレベルの技術系大学研究者と協力して、Nvidiaなどの企業が製造する高度な計算チップに依存することなく、大規模なAIモデルを実行できる、まったく新しい手頃な価格のシステムを発表しました。この革新的なシステムは、デバイスの選択肢において人工知能技術の新たな地平を切り開くものです。

Apr 10, 2025

260

Meta、AIシステムMoChaを発表：テキストが生き生きとしたアニメキャラクターに、口パクと動きは自然で滑らか

Metaとウォータールー大学の研究者らが最近、テキストによる簡単な説明から、同期した音声と自然な動きのある全身アニメーションキャラクターを生成できる、MoChaという新しいAIシステムを発表しました。この革新的な技術は、コンテンツ制作の効率と表現力を大幅に向上させ、多くの分野で大きな可能性を秘めています。従来の方法を打ち破り、全身アニメーションと正確な口パクを同期させる、これまでのAIモデルが主に顔の表情に焦点を当てていたのに対し、MoChaは全身の自然な動きをレンダリングできる点がユニークです。

Apr 2, 2025

240

報道：アップルがNVIDIAのAIシステムに10億ドル投資

Mar 26, 2025

Manus AIシステムのプロンプト漏洩、公式の対応は？

汎用AIインテリジェンス製品Manusは、リリース直後から多くのユーザーが招待コードを求めて殺到しました。製品のパフォーマンスが注目を集める一方で、Manusの裏にある技術に関しても強い関心が寄せられています。Manusを複製しようとする多くのチームが現れたことに加え、先日jianというユーザーがManusシステムをクラッキングし、単純にManusに「/opt/.manus/」ディレクトリ下のファイルを出力するよう要求したところ、重要な情報や実行コードの一部を取得することに成功しました。

Mar 11, 2025

2.1k

羅永浩氏のARスタートアップ「細紅線科技」、春の新卒採用を開始 AIシステム開発にシフト

羅永浩氏が率いるARスタートアップ企業、細紅線科技（Thin Red Line）は、2025年春の採用活動を正式に開始し、大きな注目を集めています。現在募集中の正社員ポジションはすべてプロダクトマネージャーで、シニアソフトウェアプロダクトマネージャー、AI分野ソフトウェアプロダクトマネージャー、IM分野ソフトウェアプロダクトマネージャー、BIデータプロダクトマネージャー、事業化プロダクトマネージャーなどがあります。勤務地は上海と北京ですが、具体的な給与は公開されていません。業界メディア36氪の報道によると、羅永浩氏の最新の...

Mar 10, 2025

AIシステムによる医療画像変化の精密検出

医療分野において、画像データの分析は複雑で煩雑なプロセスでした。最近、ウィル・コーネル医科大学の研究者らが、時間経過による医療画像の変化を高効率かつ正確に分析・検出できる、LILAC（学習に基づく縦断的画像変化推論）と呼ばれる新しいAIシステムを開発しました。この研究は2月20日に『米国科学アカデミー紀要』に掲載され、LILACの複数の医療現場における幅広い応用可能性を示しています。従来の医療画像分析方法は、多くのカスタマイズと事前準備を必要とする場合が多々ありました。

Feb 28, 2025

「ChatGPTの生みの親」がAI企業「シンキング・マシーンズ・ラボ」設立を発表

OpenAIの元最高技術責任者（CTO）ミラ・ムラティ氏が昨年秋にOpenAIを突然退社した後、新たな起業の道を歩み始めました。先日、彼女は「シンキング・マシーンズ・ラボ（Thinking Machines Lab）」という新しいAIスタートアップ企業の準備を進めていることを明らかにしました。具体的な製品の詳細はまだ公開されていませんが、同社はAIシステムをより理解しやすく、カスタマイズ可能で、より幅広い能力を持つことを目指していると表明しています。シンキング・マシーン

Feb 19, 2025

1.5k

研究がAI言語モデルの限界を警告：8Kを超えるコンテキストでは性能が半減、概念推論が課題に

ミュンヘン大学、ミュンヘン機械学習センター、Adobe Researchによる最近の共同研究によると、GPT-4o、Gemini 1.5 Pro、Llama-3.3-70Bなど、12種類の最先端AI言語モデルは、長文の概念推論タスクにおいて顕著な性能低下に直面しています。これらのモデルは、少なくとも128,000トークンのコンテキスト処理をサポートしていますが、深層的な論理的関連付け能力には根本的な限界があることが示されています。研究チームは、NOLIMA（ノーテキストマッチング…

Feb 13, 2025

1.2k

Meta、新たなフレームワークを発表、高リスクAIシステムのリリース制限を計画

Metaは最近、最先端AIモデルがもたらすリスクを評価・軽減し、必要に応じて開発の中止またはこれらのシステムのリリース制限を行うことを目的とした、新たなリスクポリシーフレームワークを発表しました。このフレームワークは「最先端AIフレームワーク」と呼ばれ、MetaがどのようにAIモデルを高リスクと重要リスクの2つのカテゴリに分類し、それに応じて対策を講じてリスクを「許容できるレベル」まで軽減するかを詳細に説明しています。このフレームワークでは、重要リスクは特定の脅威シナリオの実行に独自に貢献できるものとして定義されています。一方、高リスクとは

Feb 12, 2025

1.3k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要