OpenAI ChatGPT、マルチモーダル機能正式リリース、音声対話と画像認識に対応

智能涌现

公開日AIニュース · 1 分で読めます · Sep 26, 2023

9月25日、OpenAIは人気チャットAIであるChatGPTに、音声対話や画像認識などのマルチモーダル機能を追加しました。この新機能により、ユーザーは音声対話や画像アップロードによるインタラクションが可能になり、音声認識、テキスト認識、物体検出などの機能を利用できます。マルチモーダル版ChatGPTはGPT-4Vと呼ばれ、GPT-4と同時にトレーニングが完了していましたが、安全性を考慮してリリースが延期されていました。OpenAIは、この新機能はChatGPT Plusのサブスクリプションユーザーとエンタープライズユーザー向けにまず提供されると述べています。

ファーウェイ昇騰と階躍星辰、オープンソースのマルチモーダルモデルを発表 AI新分野に進出

先日、魔楽コミュニティ（Modelers）で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。

世界のオフィス75.9％がChatGPTをワークフローに導入 AIによる職場改革

DeskTimeの最新調査によると、ChatGPTは世界中のオフィスで最も広く使用されているAIツールとなり、2024年末までに職場での採用率は75.9％に達すると予想されています。この調査は97社、2385人の従業員を対象に、2023年1月から2024年12月までの期間で行われました。AI技術の発展に伴い、ChatGPTの業務における活用範囲も拡大し、その利便性と効率性から従業員に広く歓迎されています。画像参照

AIトラフィックの巨大消費者：ChatGPTが世界トップ10サイトにランクインも、トラフィックシェアはほぼゼロ

Similarwebの最新データによると、ChatGPTは2025年2月のアクセス数が3億9050万回に達し、1月と比較して1.44％微増しました。前月比増加率は鈍化していますが、2024年2月と比較すると、前年比増加率は依然として堅調で137％に達しています。この継続的な成長により、ChatGPTは世界ウェブサイトランキングで順位を上げ続け、現在、世界デスクトップサイトで5位、デスクトップとモバイルトラフィックを合わせたランキングでは7位に位置しています。データは、ChatGPTが世界のネットワークトラフィックを占めていることを示しています。

マイクロソフトCEO、AIモデルはコモディティ化しつつあると発言　システム統合と製品開発が鍵

最近のポッドキャストで、マイクロソフトCEOのサティア・ナデラ氏は、言語モデルの成熟に伴い、AIモデルが標準化、コモディティ化しつつあると述べました。この変化により、企業のAI開発戦略の中心が、単なるモデル開発からシステム統合と製品開発へとシフトしていると指摘。ナデラ氏は、モデルだけでは不十分であり、企業は完全なシステムアーキテクチャと成功する製品に注目する必要があると強調しました。「現在のAI業界は、波のような活動の真っ只中にある」と述べ、2022年11月以降の状況を説明しました。

AIニュース