ElevenLabsは、AI音声クローンとテキスト音声変換APIに特化したスタートアップ企業で、最近、ユーザーが完全な会話型AIエージェントを構築できる新機能を発表しました。
ユーザーは現在、ElevenLabsの開発者プラットフォームで、音声のトーンや応答の長さなど、ニーズに合わせて会話型AIエージェントの様々な変数をカスタマイズできます。
ElevenLabsはこれまで、様々な音声とテキスト音声変換サービスを提供してきました。同社の成長担当責任者であるSam Sklar氏はTechCrunchのインタビューで、多くの顧客が既にこのプラットフォームを使用して会話型AIエージェントを作成していると述べています。しかし、ナレッジベースの統合と顧客の中断処理が最大の課題でした。そのため、ElevenLabsは、このプロセスを簡素化するために、完全な会話型ボットパイプラインを構築することにしました。
ユーザーは、ElevenLabsアカウントにログインし、テンプレートを選択するか、新規プロジェクトを作成することで、会話型AIエージェントの構築を開始できます。エージェントの主要言語、最初のメッセージ、システムプロンプトを選択して、エージェントの個性を作成できます。
さらに、開発者は、大規模言語モデル(Gemini、GPT、Claudeなど)、応答の温度(創造性を決定)、トークンの使用制限を選択する必要があります。
ユーザーは、ファイル、URL、テキストブロックなどのナレッジベースを追加して、会話型ボットの機能を強化することもできます。また、独自ののカスタム大規模言語モデルをボットと統合することも可能です。ElevenLabsのSDKはPython、JavaScript、React、Swiftに対応しており、さらにWebSocket APIを提供することで、さらなるカスタマイズが容易になります。
同社は、エージェントと会話する顧客の名前やメールアドレスなど、データ収集基準をユーザーが定義することも許可しており、自然言語を使用して通話の成功と失敗を評価する基準を定義できます。
ElevenLabsは既存のテキスト音声変換パイプラインを活用しており、新しい会話型AI製品向けの音声テキスト変換機能も開発中です。現在、同社は音声テキスト変換APIを単独で提供していませんが、将来的には提供する可能性があり、Google、Microsoft、Amazonなどの企業の音声テキスト変換API、そしてOpenAIのWhisper、AssemblyAI、Deepgram、Speechmatics、Gladiaなどの専門的なAPIと競合することになります。
同社は30億ドル以上の評価額で新たな資金調達ラウンドを計画しており、会話型AIエージェントを構築しているVapiやRetellなどの他の音声AIスタートアップ企業と競合しています。さらに重要なのは、ElevenLabsはOpenAIのリアルタイム会話APIとも競合することになります。しかし、ElevenLabsは、そのカスタマイズ能力とモデルの切り替えの柔軟性によって、競争において優位に立つことができると確信しています。
要点:
💬 ElevenLabsは、ユーザーが様々な変数をカスタマイズできる会話型AIエージェント構築の新機能を発表しました。
📚 ユーザーはナレッジベースを追加してエージェントの機能を強化し、カスタム大規模言語モデルを統合できます。
🚀 ElevenLabsは30億ドル以上の評価額で資金調達を計画しており、OpenAIなどの競合他社と競争します。