【AI日報】へようこそ!ここは、人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題、開発者への注目情報、技術トレンドの洞察、革新的なAI製品の応用情報を提供します。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、百度、文心大模型4.5 Turboを4月25日に発表

百度は、4月25日に開催されるCreateカンファレンスで、文心大模型4.5 Turboを発表すると発表しました。具体的な詳細はまだ明らかになっていませんが、業界は大きな期待を寄せています。文心大模型4.5と文心大模型X1は先月発表され、ユーザーに無料で公開されており、百度のAI分野における深い蓄積を示しています。文心大模型4.5はマルチモーダル理解能力に優れており、API呼び出し価格も非常に競争力があり、多くの開発者や企業の注目を集めています。

image.png

【AiBase要約:】

🚀 文心大模型4.5 Turboは4月25日のCreateカンファレンスで発表されます。詳細は後日公開。

💡 文心大模型4.5はマルチモーダル理解能力に優れ、API呼び出し価格はGPT4.5のわずか1%です。

🌟 百度の創設者である李彦宏氏は、文心大模型4.5が百度史上最高のモデルになると述べています。

2、AIエージェントの大変革!GoogleがオープンソースのA2Aプロトコルを発表、エージェント間の自由な「対話」を実現

Google Cloudは、新しいオープンソースプロトコルAgent2Agent(A2A)を発表しました。これは、異なるAIエージェント間の協調と情報交換を促進することを目的としています。このプロトコルは標準化された通信方法を通じて、エージェント間の障壁を取り払い、情報の孤島問題を解決します。A2Aプロトコルの設計原則には、長期的なタスクのサポート、デフォルトのセキュリティ、モーダル非依存性などが含まれており、複雑なAIアプリケーションにおける適用性を確保しています。image.png

【AiBase要約:】

🚀 A2Aプロトコルは、異なるベンダーのAIエージェント間のシームレスな協調と情報交換を促進し、情報の孤島を解消します。

🔒 このプロトコルは既存の標準に基づいて構築されており、エンタープライズレベルのセキュリティをサポートし、統合プロセスを簡素化します。

🌐 50社以上のテクノロジーパートナーがA2Aプロトコルをサポートし、企業におけるAIのより広範な適用を推進しています。

3、微信:ビデオアカウントにおけるAIツール不正使用に関する特別対策を実施

微信ビデオ創作安全センターは最近、一部の配信者によるライブ配信におけるAIツールの不正使用に関する特別対策を発表しました。これらの行為は、視聴者を誤解させるだけでなく、他人の肖像権を侵害し、関連する運営規約に違反しています。プラットフォームは、違反の程度に応じて適切な罰則を科し、ライブ配信環境の健全性と安全性を確保します。同時に、プラットフォームはAI技術の合理的な使用を奨励し、作業効率の向上を図りますが、不正な利益追求行為は断固として阻止します。

image.png

【AiBase要約:】

🚫 一部の配信者がライブ配信でAIツールを不正に使用し、視聴者を誤解させ、肖像権を侵害しています。

⚖️ 配信者はライブ配信資格を申請する必要があります。AIツールを使用して顔の表情を変えることは違反となります。

📢 ユーザーは通報機能を使用して違反行為を報告できます。プラットフォームは迅速に対応します。

4、バイトダンス、Multi-SWE-benchをオープンソース化、大規模言語モデルによるコードインテリジェントアップグレードを推進

バイトダンスのDoubao大規模言語モデルチームは最近、Multi-SWE-benchをオープンソース化しました。これは、大規模言語モデルのバグ自動修正能力の評価を向上させることを目的とした、初の多言語コード修正ベンチマークデータセットです。以前のSWE-benchと比較して、Multi-SWE-benchはPythonだけでなく、Java、TypeScriptなど6つの言語を追加し、1632個の現実的なタスクを構築し、難易度分類メカニズムを導入しました。

image.png

【AiBase要約:】

🛠️ Multi-SWE-benchは、7つの主要なプログラミング言語を網羅した、初の多言語コード修正ベンチマークデータセットです。

📊 このデータセットには1632個の現実的なタスクが含まれており、厳格な選別と手動検証が行われ、信頼性の高い品質が保証されています。

🤖 実験によると、大規模言語モデルはPythonの修正では良好なパフォーマンスを示していますが、他の言語の修正率は10%未満です。

5、京東零售、独自の10億規模の時系列大規模モデルTimeHFを発表 商品売上の予測が可能に

京東零售技術チームは、独自の10億規模の売上予測時系列大規模モデルTimeHFを発表しました。このモデルは、人間のフィードバックによる強化学習技術により、売上予測の精度を10%以上向上させました。TimeHFは京東の自動補充シナリオで優れたパフォーマンスを発揮し、複数の公開データセットで業界水準を上回り、時系列予測の新たなベンチマークとなっています。

image.png

【AiBase要約:】

🛠️ TimeHFモデルは、人間のフィードバックによる強化学習技術に基づいており、予測精度は10%以上向上し、需要予測の不確実性を大幅に低減します。

📊 京東チームは15億サンプルの高品質データセットを統合し、前例のない複雑なデータセットを構築し、モデルのトレーニングの基礎を築きました。

🚀 TimeHFは複数の公開データセットでSOTAの結果を達成し、より強力なゼロショット性能と予測精度を示しており、京東のサプライチェーンシステムに適用されています。

6、Google Firebase Studioが登場:AI駆動のワンストップ開発プラットフォームが衝撃的なデビュー

Googleが新たに発表したFirebase Studioは、複数の開発ツールを統合したクラウドベースの開発プラットフォームで、AI技術を使用して開発プロセスを簡素化することを目的としています。ワンストップ開発エクスペリエンスを提供し、アイデアからデプロイまでの全プロセスをサポートしており、特にモバイル開発分野で優れたパフォーマンスを発揮します。現在プレビュー段階ですが、強力な機能と無料トライアルポリシーにより、開発者はより簡単にプロジェクト開発を行うことができ、将来のプログラミングエコシステムの変革を示唆しています。

image.png

【AiBase要約:】

🛠️ Firebase Studioは複数の開発ツールを統合し、ワンストップ開発エクスペリエンスを提供し、アプリケーションの迅速な構築をサポートします。

🌐 このプラットフォームにはモバイルシミュレーターが組み込まれており、開発者はクラウド上で直接iOSとAndroidアプリをデバッグでき、モバイル開発の効率が向上します。

🔍 現在プレビュー段階であり、機能の安定性は向上させる必要があります。将来的には、無料サービスと有料サービスのバランスを取る必要があります。

詳細リンク:https://top.aibase.com/tool/firebase-studio

7、テキストから複雑なキャラクターまで:最強のSVG生成大規模モデルOmniSVGが登場!

OmniSVGの発表は、SVG生成技術の大きな進歩を示しています。高度なビジョン言語モデルと革新的なSVGトークナイザーを組み合わせることで、生成効率と品質を大幅に向上させました。このモデルは、テキストと画像からのSVG生成をサポートするだけでなく、複雑なアニメーションキャラクターも生成でき、非常に高い柔軟性と品質を示しています。OmniSVGの登場は、グラフィックデザインとWeb開発分野に新たな可能性をもたらし、AIGCコミュニティの発展を促進しています。

image.png

【AiBase要約:】

🌟 OmniSVGはStepFunと復旦大学が共同開発した高度なSVG生成モデルで、優れたマルチモーダル生成能力を備えています。

📊 新しく発表されたMMSVG-2Mデータセットには200万個のSVGリソースが含まれており、標準化された評価プロトコルを提供することで、SVG生成技術の発展を推進しています。

🚀 OmniSVGによって生成されたSVGは、視覚効果が優れているだけでなく、編集可能であり、専門的なデザインワークフローに適しています。

詳細リンク:https://omnisvg.github.io

8、Google、エージェント開発キット:ADKを発表、AIエージェント開発の新たな波を牽引

Googleは2025年4月9日、Agent Development Kit(ADK)を発表しました。これはAIエージェント開発における大きな進歩を示しています。オープンソースフレームワークであるADKは、マルチエージェントシステムの構築と管理を簡素化し、柔軟な開発と展開をサポートすることを目的としています。モジュール式設計とマルチモーダルインタラクション機能により、開発者はより自然な方法でエージェントを作成でき、Google Cloudサービスとの深い統合により、エンタープライズレベルのアプリケーションの効率が向上します。image.png

【AiBase要約:】

🚀 ADKはGoogleが発表したオープンソースのエージェント開発フレームワークで、マルチエージェントシステムの構築と管理を簡素化することを目的としています。

🎤 マルチモーダルインタラクションをサポートし、双方向の音声とビデオストリーム機能を備え、エージェントの自然な会話能力を向上させます。

🌐 Google Cloudサービスと深く統合されており、迅速なプロトタイピングとシームレスな展開をサポートし、技術的なハードルを下げます。

9、Veo 2がGemini APIに正式登場:AIビデオ生成革命が本格始動

Google傘下のVeo2ビデオ生成モデルがGemini APIを通じて開発者に公開され、AIビデオ生成技術の新たな段階を示しています。このモデルは、高忠実度のビデオ生成と複雑な指示への正確な応答で知られており、テキストからビデオ、画像からビデオの生成をサポートしています。開発者はこのAPIを柔軟に統合し、ビジネスとクリエイティブの広範な可能性を探ることができます。しかし、コンテンツの真実性と著作権帰属に関する議論も同時に起こっており、Googleは誤用リスクを軽減するために生成されたビデオに透かしを埋め込んでいます。

image.png

【AiBase要約:】

🎥 Veo2はGemini APIを通じて公開され、テキストからビデオ、画像からビデオの生成をサポートし、AIビデオ生成技術の発展を推進しています。

💡 開発者はAPIを通じてVeo2を柔軟に統合し、パーソナライズされたショートビデオやインタラクティブなストーリー体験の多様なアプリケーションを探求できます。

⚖️ 高い現実性のある出力は、コンテンツの真実性と著作権に関する議論を引き起こしており、Googleは誤用リスクを軽減するために透かしを埋め込んでいます。

詳細リンク:https://ai.google.dev/gemini-api/docs/video

10、Anthropic、Claude Maxの高価格帯サブスクリプションサービスを発表、月額料金は最高200ドル

Anthropic社は最近、Claude Maxのサブスクリプションプランを発表しました。これは、ハイエンドユーザーの人工知能サービスへのニーズに応えることを目的としています。このプランは、月額100ドルと200ドルの2つの価格オプションを提供し、使用制限が大幅に引き上げられ、より多くのユーザーを引き付けています。現在、無制限の使用プランはありませんが、同社は教育分野向けの「Claude for Education」プロジェクトなど、他の収益源を積極的に模索しています。

image.png

【AiBase要約:】

🌟 Claude Maxのサブスクリプションプランが発表され、月額料金は最高200ドルで、ハイエンドユーザー向けに設計されています。

📈 2つの価格オプションがあり、使用制限が大幅に引き上げられ、より多くのユーザーを引き付けています。

🎓 教育分野のAIニーズに注目し、「Claude for Education」プロジェクトを探求しています。

11、OminiControl Art発表:GPT-4oのジブリなどの芸術様式をFLUXモデルに凝縮

2025年4月9日、OminiControl Art技術の発表は、AIアート創作分野における大きな進歩を示しています。この技術はOminiControlフレームワークを通じて、OpenAIのGPT-4oの芸術様式とFLUX.1モデルを組み合わせることで、ユーザーに高品質の芸術画像を生成するための効率的で洗練されたツールを提供します。その設計理念は簡潔さと実用性を重視しており、一般ユーザーでも簡単に使用でき、AIと芸術のさらなる融合を促進しています。

image.png

【AiBase要約:】

🖼️ OminiControl Artは、GPT-4oの芸術様式とFLUX.1モデルを組み合わせることで、AIアート生成の新たな可能性を切り開きます。

⚙️ OminiControlフレームワークは、少量のパラメータを追加することで、拡散変換器モデルを柔軟に制御し、芸術創作の効率を向上させます。