【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、百川智能が全シーン対応の深層思考モデルBaichuan-M1-previewを発表、百小応で利用可能に

百川社は本日、全シーン対応の深層思考モデルBaichuan-M1-previewとオープンソースの医療強化大規模言語モデルBaichuan-M1-14Bを含むBaichuan-M1シリーズモデルを発表しました。これらのモデルは、技術革新と性能の両方で優れた成果を上げており、特にBaichuan-M1-previewは複数の権威ある評価で競合他社を上回り、強力な深層思考能力と医療エビデンスに基づくモデルを示し、医療分野への応用を強力にサポートします。

image.png

【AiBase要約:】

🧬 Baichuan-M1-previewは、国内初の言語、視覚、検索推論能力を備えたモデルで、優れた性能を示しています。

🏥 Baichuan-M1-14Bは、医学知識と臨床能力の評価において、より多くのパラメーターを持つモデルを上回り、強力な医療能力を備えています。

🚀 百川社はBaichuan-M1-14Bをオープンソース化することで、イノベーションを促進し、医療技術の広範な応用を推進することを目指しています。

2、OpenAIが初のAIエージェントOperatorを発表、ChatGPT Proユーザー向けに先行提供

OpenAIが新たに発表したAIエージェントOperatorは、ユーザーがインターネット上でさまざまなタスクを実行するのを支援することを目的としており、まずChatGPT Proユーザー向けに提供されます。このツールは、高度な視覚能力と強化学習を組み合わせることで、ウェブページとインタラクトし、自己修正機能も備えています。Operatorは、設計段階からセキュリティを重視しており、ユーザーが機密情報を扱う際にも制御を維持できるように設計されています。

image.png

【AiBase要約:】

🌐 OpenAIは、「Operator」AIエージェントを発表し、ユーザーがオンラインでタスクを実行するのを支援します。まずはChatGPT Proユーザー向けに提供されます。

🖱️ Operatorは、ブラウザを介してウェブページとインタラクトでき、自己修正機能とユーザー制御機能を備えており、セキュリティを確保しています。

🤝 OpenAIは複数の有名企業と協力し、現実のニーズに応えることに尽力しており、将来的にはより多くのユーザーへの展開を計画しています。

詳細はこちら:https://openai.com/index/introducing-operator/

3、HeyGenがデジタルヒューマンのモーションコントロール機能を発表 楽器演奏やダンスも可能に

HeyGenが新たに発表したデジタルヒューマンのモーションコントロールシステムは、仮想キャラクターの大きな身体動作の操作を実現しました。この技術革新により、デジタルヒューマンは基本的な微表情だけでなく、楽器演奏やダンスなどの複雑な身体動作をスムーズに実行できるようになりました。運動学制御アルゴリズムの導入により、動作の遅延は12ミリ秒に短縮され、ビデオ制作の効率が大幅に向上しました。

【AiBase要約:】

🎹 HeyGenのデジタルヒューマンモーションコントロールシステムは、仮想キャラクターの複雑な身体動作の操作を実現し、楽器演奏やダンスをスムーズに実行できます。

💡 このシステムは、深層ニューラルネットワークを使用して仮想キャラクターを生成し、リアルタイムで200以上の関節位置データを生成し、生物力学的な特徴を示します。

🚀 ビデオ制作効率は約47%向上し、ダイナミックなシーン制作コストは従来方式の1/8に削減されました。将来的には触覚フィードバックシミュレーションも統合される予定です。

詳細はこちら:https://app.heygen.com/

4、PerplexityがAndroidモバイルアシスタントを発表 メール作成、ディナー予約などに対応

Perplexityは最近、Androidユーザー向けに設計された新しいAIアシスタントを発表しました。このアシスタントは、メールの作成、リマインダーの設定、ディナーの予約など、さまざまなタスクを実行できます。このアシスタントはマルチモーダル機能を備えており、画面の内容を認識したり、カメラを使用して周囲のものを認識したりすることで、ユーザーの操作性を向上させています。実際の使用感では、アシスタントの反応速度と正確性に感銘を受けました。現在も対応アプリケーションと機能の拡張を続けていますが、その可能性は明らかです。

【AiBase要約:】

🌟 アシスタントは、メールの作成、リマインダーの設定、レストランの予約など、さまざまな機能に対応しています。

📱 マルチモーダル機能を備えており、画面の内容とカメラを通して周囲のものを認識できます。

🚀 現在、Spotify、YouTube、Uberなどのアプリに対応しており、機能は継続的に拡張されています。

5、元象がスマートデジタルヒューマンプラットフォーム「元象日播」を発表

深圳元象信息科技有限公司が発表したスマートデジタルヒューマンプラットフォーム「元象日播」は、高い自然度のカスタマイズ機能とリアルタイムインタラクション機能により、ブランドのプレゼンテーションとコンテンツ制作に革新的なソリューションを提供します。このプラットフォームの統合ツールにより、ユーザーはライブ配信空間を迅速に構築し、独自開発の大規模言語モデルを通じて視聴者とのインタラクションを実現し、ユーザーエクスペリエンスを大幅に向上させることができます。

image.png

【AiBase要約:】

🎥 元象日播プラットフォームは、ワンストップのライブ配信ツールを提供し、ユーザーは迅速にプロフェッショナルなライブ配信空間を構築できます。

🗣️ 音声クローン技術により、ユーザーは簡単に個性的なデジタルヒューマンの見た目と声をカスタマイズできます。

📈 このプラットフォームは、複数の業界で広く利用されており、顧客の販売転換率を大幅に向上させています。

6、300倍のサイズ削減!Hugging FaceがSmolVLMモデルを発表:コンパクトでスマート、スマホでも動作可能に

Hugging Faceが発表したSmolVLMモデルは、そのコンパクトなサイズと卓越した性能で、AI技術の新たな潮流をリードしています。このモデルは、スマートフォンなどの小型デバイスでも動作するだけでなく、大規模データセンターを必要とする旧モデルIdefics80Bを凌駕する性能を示しており、実用的なAI展開における大きな進歩を示しています。

image.png

【AiBase要約:】

🌟 SmolVLMモデルはスマートフォンで動作し、300倍大きいIdefics80Bモデルを上回る性能を発揮します。

💰 SmolVLMモデルは、企業の計算コストを大幅に削減し、処理速度は毎秒16インスタンスに達します。

🚀 このモデルの技術革新により、中小企業やスタートアップ企業は、短期間で複雑なコンピュータービジョン製品を開発できるようになります。

詳細はこちら:https://huggingface.co/blog/smolervlm

7、中国聯通が元景思考連鎖大規模言語モデルを発表:GPT-4を上回る性能

中国聯通は最近、元景思考連鎖大規模言語モデルを発表し、人工知能分野における重要な進歩を示しました。この国営企業がオープンソース化した汎用思考連鎖大規模言語モデルは、卓越した「ゆっくりとした思考」能力と多様なシナリオでの推論能力を示しており、複数の評価において、OpenAIのGPT-4などの現時点で最先端の汎用言語モデルを上回る性能を示しています。

業界初!中国聯通が元景思考連鎖大規模言語モデルを発表:OpenAIに匹敵する性能

【AiBase要約:】

🚀 元景思考連鎖大規模言語モデルは、中国聯通が初めてオープンソース化した国営企業の汎用思考連鎖大規模言語モデルであり、強力な「ゆっくりとした思考」能力と推論能力を備えています。

📊 主要なランキング評価において、このモデルはOpenAI GPT-4およびその他のトップレベルの言語モデルを上回る性能を示し、その競争力を示しています。

🔍 このモデルは、タスクと難易度への適応を実現し、回答の効率と正確性を向上させており、すでに複数の分野で成功裏に適用されています。

詳細はこちら:https://github.com/UnicomAI/Unichat-32B-c1.git

8、熱心なファン!海外のソフトウェアエンジニアがOGOpenAI.comドメインを購入し、DeepSeekにリダイレクト

最近、ソフトウェアエンジニアのアナナイ・アローラ氏が非常に低い価格でOGOpenAI.comドメインを購入し、中国のAIラボDeepSeekにリダイレクトしました。DeepSeekはオープンソースAI分野における画期的な進歩で注目を集めており、そのAIモデルは、一部のベンチマークテストでOpenAIのo1モデルを上回る性能を示しています。これとは対照的に、OpenAIは強力なモデルのリリースに慎重な姿勢を示しており、業界からの批判に直面しています。

【AiBase要約:】

🌐 アナナイ・アローラ氏がOGOpenAI.comドメインを購入し、DeepSeekにリダイレクトしました。

📊 DeepSeekのAIモデルは、一部のベンチマークテストでOpenAIのo1モデルを上回る性能を示しています。

🔍 OpenAIは、強力なモデルをリリースできていないことで批判を受け、業界からの疑問に直面しています。

9、OpenAI CEOがChatGPT無料版にo3-miniを導入すると発表、効率は倍増!

OpenAIのCEOであるサム・アルトマン氏は、ChatGPTの無料版が新しいo3-miniモデルにアップグレードされることを発表しました。これは、ユーザーエクスペリエンスの向上と日常的なニーズへの対応を目的としています。有料ユーザーは、より多くの使用機会を得て、生産性を向上させることができます。この動きは、人工知能の民主化を促進するだけでなく、数百万人のユーザーに最先端技術へのアクセスを提供し、同時に有料ユーザーの価値ある体験を保証します。

【AiBase要約:】

🌟 無料ユーザーは、新しいo3-miniモデルを利用でき、より高速な応答速度が得られます。

💼 有料ユーザーは、より多くのo3-miniの使用機会を得て、生産性を向上させることができます。

📈 OpenAIは、人工知能の民主化を推進し、より多くのユーザーが最先端技術を利用できるようにすることに尽力しています。