人工知能スタートアップ企業ElevenLabsは、水曜日に新しい機能「GenFM」を発表しました。この機能は、ユーザーが様々な種類のコンテンツをアップロードして、GoogleのNotebookLMのようなマルチトラックのポッドキャストを生成することを可能にします。

image.png

この機能は、ElevenLabs ReaderのiOSアプリで利用可能になり、英語、ヒンディー語、ポルトガル語、中国語、スペイン語、フランス語、ドイツ語、日本語など32言語に対応しています。

GenFMを使用するには、まずYouTube動画、テキスト、またはドキュメントをアップロードします。アプリケーションは自動的に2つの声を選択してポッドキャストを作成します。

ElevenLabsは、ユーザーが選択できる10種類以上の声を提供しています。アプリケーションがAI生成ポッドキャストの準備をしている間、ユーザーは「少し間を置く」「言葉を付け加える」といった興味深いヒントが表示される場合があります。多くのツールが「えー」や「あー」といった言葉を削除するのを支援する現状において、ElevenLabsはAI生成ポッドキャストに人間味のある要素を追加することを選択しています。

ElevenLabsのモバイル成長責任者であるJack McDermott氏はインタビューで、「『えー』『あー』『うん』、『笑声』、呼吸など、人間らしい会話のつなぎ言葉やノイズをどの程度導入するかについて議論しました。自然な人間同士の会話とコンテンツの使いやすさのバランスを取ることを目指しています。」と述べています。

また、優れた長尺ポッドキャストには邪魔が少ないことが多く、より自然で深い会話の流れが彼らの目指す体験であり、異なる声と言語での音声ナレーションをよりアクセスしやすくすることを目的としていると指摘しています。

今後、ElevenLabsはより多くのカスタマイズオプションをサポートし、ユーザーが複数のソースを追加して生成AIポッドキャストを作成できるようにする予定です。9月には、GoogleがNotebookLMのAI生成会話機能を発表し、1ヶ月後にユーザーによるポッドキャスト出力のカスタマイズ機能を追加しました。

今月初め、ElevenLabsはポーランドのスタートアップエコシステムに1100万ドルを投資し、ワルシャワに研究開発センターを開設して、地元のAI人材を確保すると発表しました。同時に、同社はインドへの拡大を進めており、事業責任者を採用し、チームを編成中です。さらに、ElevenLabsは顧客向けに会話型AIエージェントも発表しました。

要点:

🌐 ElevenLabsがGenFM機能を発表。ユーザーは動画やテキストをアップロードしてマルチトラックポッドキャストを生成できます。

🎙️ この機能は自動的に2つの声を選択し、人間味のあるつなぎ言葉を付加して自然な会話体験を向上させます。

🚀 ElevenLabsは今後、より多くのカスタマイズオプションをサポートし、ポーランドとインドで事業を拡大する予定です。