【AI日報】へようこそ!ここでは、人工知能の世界を探求するための毎日のガイドを提供します。毎日、AI分野のホットな話題、開発者に焦点を当て、技術トレンドの把握、革新的なAI製品の応用に関する理解を支援します。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、アリババがMCPプロトコルを全面的にサポート、テンセントも追随

最近、中国の人工知能分野で技術標準の変革が訪れ、Model Context Protocol(MCP)が国内AIエコシステムの実質的な標準となりました。アリババとテンセントのサポートは、中国のテクノロジー大手による世界的なAI標準競争における新たな取り組みを示しています。オープンソースプロトコルであるMCPは、AIモデルと外部ツール間のインタラクションを簡素化し、相互運用性を向上させます。

image.png

【AiBase要約:】

🚀 MCPプロトコルの急速な台頭は、中国のテクノロジー企業が標準化されたプロトコルを切実に必要としていることを示しています。

🤝 アリババとテンセントのサポートにより、国内でのMCPの普及が加速し、AIエージェントの応用が促進されます。

⚖️ MCPの普及には課題がありますが、新たなAI開発エコシステムを生み出し、将来の技術競争に影響を与える可能性があります。

2、階躍星辰が新しいマルチモーダル推論モデル「Step-R1-V-Mini」を発表

階躍星辰科技チームが発表したStep-R1-V-Miniは、革新的なマルチモーダル推論モデルであり、この分野における新たなブレークスルーです。このモデルは画像とテキストの入力をサポートし、テキスト出力を生成し、優れた指示遵守能力と汎用性を備えています。マルチモーダル連合強化学習とverifiable rewardメカニズムを採用することで、Step-R1-V-Miniは視覚推論、数学的論理などにおいて優れた性能を発揮し、特にMathVision視覚推論ランキングで上位にランクインしています。

image.png

【AiBase要約:】

🧠 Step-R1-V-Miniは画像とテキストの入力をサポートし、テキスト出力を生成し、優れた指示遵守能力と汎用性を備えています。

🔍 このモデルは視覚推論分野で優れた性能を発揮し、特にMathVisionランキングで国内1位にランクインしています。

⚙️ 階躍AIウェブエンドで公開され、APIインターフェースも提供されており、開発者や研究者が利用できます。

詳細リンク:https://yuewen.cn/chats/new

3、美图WHEEが画像生成モデルMiracle F1を発表

WHEEプラットフォームは最近、人工知能画像生成モデルMiracle F1を発表しました。その卓越した画像生成品質と複雑な概念に対する深い理解により、AI画像創作分野に革命を起こしています。このモデルは、非常にリアルな画像を生成できるだけでなく、意味理解とスタイルの多様性においても優れた性能を発揮し、様々なユーザーのニーズを満たします。WHEE公式ウェブサイトでこの視覚魔法を体験できます。

image.png

【AiBase要約:】

✨ Miracle F1は非常にリアルな画像を生成し、現実世界の光と影、素材感をシミュレートします。

🧠 このモデルは複雑な概念を正確に理解し、創造性と精度を向上させ、「テレパシー」のような能力を備えています。

🌈 Miracle F1は多様なスタイルを備えており、eコマース、イベントビジュアル、イラストなど、多様なニーズに対応できます。

4、Deep ResearchがGemini 2.5 Proを搭載:Googleの最もインテリジェントなAIモデルが登場

Googleは、Deep Research機能をGemini 2.5 Pro実験版にアップグレードしたことを発表し、卓越した推論能力と情報統合技術を示しました。この技術的ブレークスルーは業界の注目を集め、AI研究ツールの重要なマイルストーンとなっています。Gemini 2.5 Proは検索効率を向上させるだけでなく、総合的な分析を行い、研究方法を変え、専門家が新しい技術に適応することを促進します。将来、GoogleはDeep Researchの適用範囲を拡大し、学術研究と商業研究にさらにインテリジェントなサポートを提供する予定です。

image.png

【AiBase要約:】

🚀 Gemini 2.5 Proのアップグレードにより、Deep Researchの検索効率と分析能力が大幅に向上し、複雑な課題を処理し、包括的なレポートを生成できます。

📊 このモデルは複数のベンチマークテストで優れた性能を発揮し、特に長いコンテキストを持つタスクにおいて、最大100万トークンのコンテキストウィンドウを備え、大量のデータを分析できます。

🌐 この技術的進歩は、AI研究ツールの重要なマイルストーンであり、学術研究と商業研究に革命的な変化をもたらすと予想されます。

5、新しいオープンソースモデルDeepCoder:超効率的なプログラミング、OpenAI o1モデルを凌駕

Together AIとAgenticaが共同でオープンソース化したDeepCoder-14B-Previewモデルは、140億個のパラメータを持ち、プログラミングテストで優れた性能を発揮し、OpenAIのo1モデルを上回っています。このモデルのオープンソースコンテンツは豊富で、モデルの重み、トレーニングデータ、トレーニング方法が含まれており、開発者が詳細な研究を行うことを容易にします。分散型強化学習と高品質のデータセットにより、DeepCoderはトレーニング効率とコード品質の両方を大幅に向上させ、AIプログラミング分野における強力な可能性を示しています。

image.png

【AiBase要約:】

🌟 DeepCoder-14B-Previewモデルは優れた性能を発揮し、OpenAIのo1モデルを上回っています。

📈 オープンソースコンテンツは豊富で、モデルの重みとトレーニングデータが含まれており、開発者の研究を容易にします。

⚙️ さまざまな技術を採用することでデータ品質とトレーニング効率を確保し、モデルの性能を大幅に向上させています。

詳細リンク:https://huggingface.co/agentica-org/DeepCoder-14B-Preview

6、推論性能が飛躍的に向上!DeepSeekが革新的な技術SPCTを発表、大規模モデルがより人間を理解する

DeepSeek AIが発表した自己主導原則批判調整技術(SPCT)は、大規模言語モデル分野における大きなブレークスルーです。この技術は、より汎用的で拡張可能なAI報酬モデルを構築し、複雑な環境におけるAIの理解力と対応能力を向上させることを目的としています。SPCTは、動的に原則とコメントを生成することにより、既存の報酬モデルが直面する入力の柔軟性、精度、推論時の拡張性、学習の拡張性などの課題を解決します。

image.png

【AiBase要約:】

✨ SPCT技術は、AI報酬モデルの汎用性と拡張性を向上させ、既存モデルの限界を克服することを目的としています。

💡 動的に原則とコメントを生成することにより、SPCTは複雑なタスクにおけるAIのパフォーマンスと推論能力を効果的に向上させます。

📈 DeepSeek-GRM-27Bは複数のベンチマークテストで従来のモデルを上回り、より高い報酬品質と推論時の拡張性を示しています。

詳細リンク:https://arxiv.org/abs/2504.02495

7、Anthropic公式発表!大学生によるClaude AI使用レポートを公開

この記事では、大学生学習における人工知能(AI)の応用、特にClaude.aiの使用状況について考察しています。匿名化された大量の対話データを分析することで、様々な専攻の学生によるAIの使用傾向と、学習におけるAIの役割を明らかにしています。AIは学生にとって便利である一方、認知能力の外部委託に関する懸念も引き起こしており、AI時代の教育者が直面する課題と機会を強調しています。

image.png

【AiBase要約:】

📊 STEM専攻の学生はAIツールの早期採用者であり、特にコンピュータサイエンス専攻の使用率は他の専攻よりも著しく高くなっています。

🛠️ 学生は主にAIを創作と分析に使用しており、特に教育コンテンツのデザインや技術的問題の解決において顕著です。

🤔 AIの使用は、学生の認知能力の外部委託に関する懸念を引き起こしており、教育者はAIの補助的役割と学生の基本的スキル開発のバランスをどのように取るべきかに注目する必要があります。

8、Amazonが次世代AI音声モデルNova Sonicを発表、口調、イントネーション、リズムの変化を捉える

Amazonが最近発表したAI音声モデルNova Sonicは、音声アシスタントAlexa +の性能向上を目指しています。このモデルは音声のローカル処理により、自然で滑らかな応答を生成でき、音声認識技術における大きなブレークスルーを示しています。Nova Sonicは複雑な環境下での音声認識能力を備えているだけでなく、ユーザーのイントネーションやスタイルに合わせて応答を調整し、ユーザーエクスペリエンスを向上させます。

image.png

【AiBase要約:】

🌟 Nova SonicはAmazonが新しく発表したAI音声モデルで、Alexa +の性能向上を目指しています。

💰 このモデルのコストはOpenAIのGPT-4oよりも80%低く、開発者により多くの選択肢を提供します。

🔊 Nova Sonicは複雑な環境下での音声認識能力を備えており、ユーザーのリクエストを迅速かつ正確に処理できます。

詳細リンク:https://www.aboutamazon.com/news/innovation-at-amazon/nova-sonic-voice-speech-foundation-model

9、Google NotebookLMがモバイルアプリケーション版を間もなくリリース

Googleの人工知能研究ツールNotebookLMが、独立したモバイルクライアントアプリケーションを間もなくリリースする予定であり、ウェブエンドからモバイルエンドへの拡張を示しています。このアップグレードにより、ユーザーはより便利な使用体験を得ることができ、モバイルアプリケーションのニーズを満たします。NotebookLMは発売以来、革新的な機能により広く注目を集めており、将来のモバイルアプリケーションはGoogleの検索機能をさらに統合し、情報処理の効率を向上させるでしょう。

image.png

【AiBase要約:】

🚀 NotebookLMはiOSとAndroid版をリリースし、モバイルエンドでの使いやすさを向上させます。

🔍 「Discover Sources」機能を追加し、ユーザーがウェブコンテンツを自動的に検索してノートブックに統合できるようにします。

🎙️ 将来的にはGoogle検索機能と深く統合され、URLから要約、マインドマップへの変換を実現する可能性があります。

10、AI動画生成技術TTT:編集や繋ぎ合わせ不要で、1分間の完全なトムとジェリーアニメーションを直接生成

この研究では、テスト時トレーニング層を導入することにより、1分間の「トムとジェリー」アニメーションビデオを生成することに成功し、AI動画生成技術における新たなブレークスルーを示しています。この技術は、画像の連続性と物語の完全性において優れた性能を発揮し、後編集も不要であり、創造的なコンテンツ制作におけるAIの巨大な可能性を示しています。いくつかの欠点はありますが、その応用範囲は広く、将来的には動画制作方法を変える可能性があります。

image.png

【AiBase要約:】

🚀 TTT層を導入することにより、モデルは後編集なしで1分間の完全なアニメーションを生成できます。

🎨 生成されたビデオは時間的一貫性と物語の連続性において優れた性能を発揮し、従来のアニメーションの品質に近づいています。

💡 この技術は、動画制作コストの削減と創造的なプロセスの加速に役立ち、将来的にはより複雑なコンテンツに拡張できる可能性があります。

詳細リンク:https://test-time-training.github.io/video-dit/

11、網信辦:2025年3月31日までに346種類の生成AIサービスが备案完了

4月8日、網信上海は公告を発表し、2025年3月31日までの生成型人工知能サービスの备案状況を明らかにしました。国家インターネット情報弁公室の要請に基づき、網信部門と関連機関は、この分野のイノベーションと規範的な応用を促進するために、生成型人工知能サービスの备案作業を共同で推進しています。

image.png

【AiBase要約:】

🌟 2025年3月31日までに、346種類の生成型人工知能サービスが国家網信辦で备案が完了しました。

📊 APIインターフェースなどを通じて呼び出される159種類の生成型人工知能アプリケーションが地方網信辦に登録されています。

🔍 オンライン上のすべてのアプリケーションは、使用する备案済みのサービス情報(モデル名と备案番号を含む)を公開する必要があります。