アリババクラウド百煉大規模モデルサービスプラットフォームは最近、「音声ビデオリアルタイムインタラクション」機能をリリースしました。これにより、ユーザーはプログラミング知識がなくても、簡単にマルチモーダルAIアプリケーションを構築できるようになりました。この新機能により、ユーザーはAIモデルをWeb、iOS、Androidアプリケーションに迅速に統合し、他の人と共有できるようになります。

ユーザーは簡単な手順でインテリジェントエージェントアプリケーションを構築できます。まず、インテリジェントエージェントアプリケーションを作成し、次にアリババクラウド百煉プラットフォームで必要なテキスト、音声、またはビジュアル理解の大規模モデルを選択して設定します。プラットフォームは200種類以上の巨大言語モデルを提供しており、強力なビジュアルインテリジェントエージェント機能を備えたアリババクラウドQwen2-VL大規模モデルも含まれています。次に、ユーザーはプロンプトを作成し、音声ビデオAPIキーを設定して、独自のAIアプリケーションを公開します。公開後、ユーザーはAPI、Webページ、微信ミニプログラム、釘釘ロボットなど、さまざまな公開チャネルを選択できます。また、音声ビデオSDKを使用して、インテリジェントエージェントをWeb、iOS、またはAndroidアプリケーションに統合することもできます。

微信截图_20241221100512.png

さらに、アリババクラウド百煉プラットフォームは追加のチュートリアルを提供しており、ユーザーは知識ベースを設定してインタラクション認識の精度を向上させたり、ワークフローを設定してAIの回答をより安定させたりすることができます。現在、アリババクラウド百煉の通義APIの価格は、100万トークンあたり最低0.3元まで引き下げられており、ユーザーは低コストで、聞く、見る、話すことができるマルチモーダルインテリジェントエージェント(AIアシスタント、AI教師、仮想コンパニオンなど)を構築できます。

この新機能のリリースにより、AIアプリケーション開発のハードルがさらに低くなり、個人や企業は迅速にインテリジェントアプリケーションを構築および展開して、多様なビジネスニーズに対応できるようになりました。アリババクラウド百煉大規模モデルサービスプラットフォームのこのアップデートは、AI技術の普及と技術応用難易度の低減における重要な進歩を示しています。