OpenAI、約7ヶ月前にデモされたChatGPTのリアルタイム動画機能をとうとうリリース

AIbase基地

公開日AIニュース · 1 分で読めます · Dec 13, 2024

414

OpenAIは今週木曜日、ChatGPT向けに開発された人間のような会話機能「高度音声モード」が視覚化されたことを発表しました。ChatGPT Plus、Team、またはProを購読しているユーザーは、スマートフォンカメラで物体を捉えることで、ChatGPTがほぼリアルタイムで反応するようになりました。

この視覚機能を備えた高度音声モードは、画面共有機能も備えており、デバイス画面上のコンテンツを分析できます。例えば、様々な設定メニューを解説したり、数学の問題にアドバイスしたりすることができます。

使い方は非常に簡単です。ChatGPTのチャット欄の横にある音声アイコンをクリックし、左下隅のビデオアイコンをクリックするだけでビデオを開始できます。画面を共有するには、三点メニューをクリックして「画面共有」を選択します。

機能の展開について、OpenAIは視覚機能付きの高度音声モードを今週木曜日から開始し、来週中に終了すると発表しました。ただし、すべてのユーザーがすぐに利用できるわけではありません。ChatGPT EnterpriseとEduユーザーは来年1月まで待つ必要があり、EU、スイス、アイスランド、ノルウェー、リヒテンシュタインのユーザーについては具体的なスケジュールはまだ発表されていません。

最近のCNN「60分」番組で、OpenAIの社長グレッグ・ブロックマンはアンダーソン・クーパーに高度音声モードの視覚分析能力を披露しました。クーパーが黒板に人体部位を描くと、ChatGPTはその絵を理解し、コメントすることができました。例えば、脳の位置は正確だと指摘し、脳の形は楕円形の方が良いと提案しました。

しかし、デモの過程で、この高度音声モードは幾何学の問題でいくつかの不正確さを露呈し、「幻覚」を生み出す可能性のあるリスクを示しました。

特筆すべきは、この視覚機能付きの高度音声モードは何度も延期されてきたことです。今年4月、OpenAIは「数週間以内」にリリースすると約束しましたが、その後、より多くの時間が必要であると述べました。今年秋の初めまで、この機能は一部のChatGPTユーザーにのみ公開され、当時は視覚分析機能は備わっていませんでした。

人工知能の競争が激化する中、GoogleやMetaなどの競合他社も同様の機能を開発しています。今週、Googleは一部のAndroidテストユーザーに対して、リアルタイムビデオ分析対話型AIプロジェクトであるProject Astraを公開しました。

視覚機能に加えて、OpenAIは今週木曜日に「サンタクロースモード」というホリデー機能も発表しました。ユーザーはChatGPTアプリのヒント欄の横にある雪の結晶アイコンをクリックして、サンタクロースの音声を有効にできます。

ChatGPT用JSONビジュアルツールリリース　無限のイメージスタイル創作を解き放つ

ChatGPT用JSONビジュアルツールが正式リリースされ、ChatGPTの画像生成能力に新たな創造性を加えました。AIbaseの情報によると、このツールは50種類以上の独特な美的コードを提供し、属性ランダム化機能と組み合わせることで、無限のスタイルの組み合わせを生成できます。ユーザーは画像とJSONスタイルコードを入力するだけで、個性的なビジュアルコンテンツを作成できます。リリースに関するニュースはソーシャルメディアで大きな反響を呼び、特にシュールなテクノロジー風スタイルがコミュニティで高く評価されています。主な機能：柔軟なスタイル生成とランダム化された組み合わせJSON

OpenAI、2029年売上高1250億ドル、2030年月間アクティブユーザー30億人を予測

OpenAIは最近、将来の収益に関する予測を発表し、2029年までに総収益が1250億ドルに達すると予測しています。AIエージェント事業とチャネル収益が主な推進力となります。予測によると、AIエージェント事業は総収益の約4分の1を占め、収益は290億ドルに達すると予想され、チャネル収益は250億ドルに達すると予想されています。画像引用元:画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを通じて提供されています。ChatGPTの成功に伴い、OpenAIの…

グーグルGemini、月間アクティブユーザー数が3.5億人を突破もChatGPTとの差は依然として存在

最新の報道によると、グーグルのAIチャットボットGeminiの世界月間アクティブユーザー数は3.5億人に達しました。このデータは現在進行中のグーグルに対する独禁法訴訟の中で明らかになったもので、過去1年間でGeminiが著しいユーザー増加を遂げたことを示しています。注目すべきは、Geminiの日間アクティブユーザー数も大幅に増加しており、2023年10月の900万人から現在の3500万人へと、相当な伸びを見せていることです。Geminiのユーザー数は急速に増加していますが、

OpenAI、ChatGPTの新しい画像生成機能APIを発表：開発者はAI描画機能を簡単に統合可能に

OpenAIは先日、最新の画像生成機能をAPIを通じて開発者に公開し、この高度な技術を様々なアプリケーションやサービスに統合できるようにすると発表しました。このニュースは、特に画像処理や創作分野において、開発者にとって新たな機会をもたらすことは間違いありません。新たに発表された画像生成モデルの名前は「gpt-image-1」で、ChatGPTの画像生成技術を基盤としています。3月末にこの機能が公開されて以来、ユーザーはリアルなジブリ風の画像などを作成することが可能です。