Adobe、AIオーディオツール「Sketch2Sound」を発表　ハミングや音声模倣でサウンドエフェクトを作成

AIbase基地

公開日AIニュース · 1 分で読めます · Dec 23, 2024

1.2k

最近、Adobe Researchとノースウェスタン大学が共同で開発したSketch2SoundというAIシステムが登場し、サウンドデザイナーの仕事のやり方を一変させる可能性を秘めています。Sketch2Soundを使えば、ハミング、音の模倣、簡単なテキストによる説明だけで、プロフェッショナルな効果音や環境音を制作できます。

このシステムは、ユーザーの声帯からの入力における3つの重要な要素、音量、音色（明るいか暗いかを決定する）、音高を分析します。その後、これらの特徴とユーザーのテキスト説明を組み合わせて、必要な音を生成します。例えば、「森の雰囲気」と入力して短い音を出すと、具体的な指示がなくても、システムはそれを鳥の鳴き声として自動的に認識します。

Sketch2Soundのもう一つの大きな特徴は、文脈を理解する能力です。音楽制作では、「ベースドラム、スネアドラム」と入力し、リズムをハミングで入力できます。システムは、ベースドラムを低音のノートに、スネアドラムを高音のノートにインテリジェントに配置します。このインテリジェントな処理により、サウンドデザインのプロセスが大幅に簡素化されます。

専門家のニーズを満たすために、研究チームは特別なフィルタリング技術を組み込み、ユーザーが必要に応じて生成された音の精度を調整できるようにしています。サウンドデザイナーは、非常に正確な制御を選択することも、よりリラックスした、近似的な方法を選択することもでき、この柔軟性により、Sketch2Soundは特にフォーリーアーティストに人気が出そうです。映画やテレビ番組の効果音を制作するこれらの専門家は、このツールを使用することで、物体を操作して音を出す必要がなくなり、音声とテキストの説明だけでより迅速に効果音を制作できます。

研究者によると、入力された録音の音響特性が、生成された音に悪影響を与える場合があるとのことですが、彼らは現在この問題の解決に取り組んでいます。現時点では、AdobeはSketch2Soundを商用製品として発売するかどうか、具体的な発売時期については発表していません。

プロジェクト入口:https://hugofloresgarcia.art/sketch2sound/

要点:
🎵 Sketch2Soundは、ハミングとテキストの説明で効果音を生成できる新しく開発されたAIツールです。
🔊 このシステムは音量、音色、音高を分析し、ユーザーの音声入力とテキストを組み合わせて目標の音響を生成します。
🎬 フォーリーアーティストに特に適しており、映画やテレビ番組の効果音を迅速に生成し、作業効率を向上させます。

AIシステムによる医療画像変化の精密検出

医療分野において、画像データの分析は複雑で煩雑なプロセスでした。最近、ウィル・コーネル医科大学の研究者らが、時間経過による医療画像の変化を高効率かつ正確に分析・検出できる、LILAC（学習に基づく縦断的画像変化推論）と呼ばれる新しいAIシステムを開発しました。この研究は2月20日に『米国科学アカデミー紀要』に掲載され、LILACの複数の医療現場における幅広い応用可能性を示しています。従来の医療画像分析方法は、多くのカスタマイズと事前準備を必要とする場合が多々ありました。

研究がAI言語モデルの限界を警告：8Kを超えるコンテキストでは性能が半減、概念推論が課題に

ミュンヘン大学、ミュンヘン機械学習センター、Adobe Researchによる最近の共同研究によると、GPT-4o、Gemini 1.5 Pro、Llama-3.3-70Bなど、12種類の最先端AI言語モデルは、長文の概念推論タスクにおいて顕著な性能低下に直面しています。これらのモデルは、少なくとも128,000トークンのコンテキスト処理をサポートしていますが、深層的な論理的関連付け能力には根本的な限界があることが示されています。研究チームは、NOLIMA（ノーテキストマッチング…

OpenAIとソフトバンクが提携、企業向けAIシステム「Cristal」を発表

OpenAIとソフトバンクは戦略的パートナーシップを締結し、企業向け人工知能システム「Cristal」を発表しました。このシステムは、日本の企業における業務自動化を支援し、ビジネスオペレーションの変革を目指しています。人工知能技術の急速な発展に伴い、多くの企業がデジタルトランスフォーメーションによる効率性と競争力向上を目指しており、Cristalはそのニーズに応えるものです。画像注記：画像はAIによって生成され、画像ライセンスプロバイダーMidjourneyから提供されています。Cristalシステムは企業向けに…

アップル社の新しいAIシステムFerret-UI 2がUI操作体験を刷新、デバイスを簡単に操作

アップル社は先日、次世代人工知能システムFerret-UI2を発表しました。このクロスプラットフォームAIアシスタントは、UI要素認識において大きな進歩を遂げ、テストスコアは89.73点を記録し、GPT-4Vの77.73点を大きく上回りました。これは卓越した性能を示しています。このシステム最大の特長は、ユーザーの意図をスマートに理解する能力です。従来の座標クリックベースの操作方法とは異なり、Ferret-UI2はユーザーの自然言語指示に基づいて、自動的に位置を特定し、対応する操作を実行します。研究チームはG…

AIニュース