【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、OpenAIが新しい画像生成モデルを発表、Googleの一言で画像編集に挑む
OpenAIは最近、最新のGPT-4oモデルを発表しました。このモデルは高度な画像ジェネレーターを統合し、顕著な画像レンダリング能力と多様な入出力サポートを示しています。CEOのサム・アルトマンはソーシャルメディアで、モデルが生成した画像への驚きと期待を共有し、ユーザーの創造性を促しています。新しいモデルの自己回帰特性により、複雑な指示の処理において優れたパフォーマンスを発揮しますが、まだいくつかの欠点も残っています。しかし、OpenAIは継続的な最適化を約束しています。
【AiBase要約:】
🎨 新モデルは高品質な画像生成をサポートし、テキストコンテンツを正確にレンダリングし、多様な入出力方法を提供します。
🤖 GPT-4oは自己回帰モデルを採用し、10~20個の複雑な指示を処理でき、より強力な画像生成能力を示しています。
🔒 生成されたすべての画像にはC2PAメタデータ識別子が付与され、コンテンツのソースの追跡可能性が確保され、セキュリティが強化されます。
2、可灵AIの収益が1億元を突破、収益の大部分はCエンドのサブスクリプションサービスによるもの
快手(Kuaishou)が昨年6月に発表した可灵AIは、売上高が1億元を超え、国内の動画生成AIアプリケーションの中でトップクラスとなっています。強力な機能と早期の市場投入により、可灵AIは競争の激しい市場で確固たる地位を築いています。快手は技術革新と資本投入を通じて、可灵AIのさらなる発展を推進し、世界売上高トップの動画生成AIアプリケーションを目指しています。
【AiBase要約:】
🚀 可灵AIは発表以来、売上高が1億元を超え、国内動画生成AIの商業化のベンチマークとなっています。
🔄 快手はAI技術によって既存事業をアップグレードし、研究開発と収益の好循環を促進しており、20回以上のバージョン更新を実施しています。
🌍 可灵AIは国際市場で高い競争力を持ち、ユーザーベースが急速に拡大しており、世界中のコンテンツクリエイターにとって人気の選択肢となっています。
3、Googleが新しい推論AIモデルGemini 2.5とGemini 2.5 Pro実験版を発表
Googleは最近、最新のAI推論モデルGemini 2.5とそのProバージョンを発表し、AI技術の大きな進歩を示しました。Gemini 2.5は「思考」能力を備えており、複数のベンチマークテストで競合他社を上回り、特にコード編集とソフトウェア開発能力において優れたパフォーマンスを発揮しています。今後、Googleはさらに強力な200万トークンのコンテキストウィンドウを導入し、モデルのパフォーマンスをさらに向上させる予定です。
【AiBase要約:】
🌟 Gemini 2.5とProバージョンは推論能力を備えており、AI技術の新たな進歩を示しています。
🚀 複数のベンチマークテストにおいて、Gemini 2.5 Proは多くの競合他社を上回っています。
📈 200万トークンのコンテキストウィンドウが導入され、AIモデルの処理能力がさらに向上します。
詳細リンク:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#advanced-coding
4、テンセントの混元T1正式版とDeepSeek V3-0324がリリース
テンセントは最近、混元T1正式版とDeepSeek V3の最新版を発表し、深層学習と人工知能分野におけるさらなる発展を示しました。混元T1正式版は以前のバージョンと比べて速度と性能が大幅に向上し、秒単位の応答を実現し、ユーザーエクスペリエンスを最適化し、さまざまな推論タスクに適しています。同時に、DeepSeek V3も最適化され、より正確な分析と思考能力を提供します。
【AiBase要約:】
🌟 混元T1正式版とDeepSeek V3最新版が同時にリリースされ、ユーザーは最新の深層思考技術を体験できます。
⚡ 新バージョンはT1Previewと比べて全面的にアップグレードされ、速度と性能が向上し、秒単位の応答を実現しています。
☁️ テンセントクラウドは混元T1をサポートし、ユーザーに効率的なインテリジェントサービスと技術サポートを提供することに尽力しています。
5、ゼロコストで爆売れ商品を撮影!AIeコマース動画生成ツールProduct Anyshoot登場
Product Anyshootは、eコマース業界向けに設計された革新的なAI動画生成ツールで、商品の表示効率とリアル感を向上させることを目的としています。販売者は商品画像をアップロードするだけで、システムが商品を事前に作成された動画にインテリジェントに組み込み、制作プロセスを大幅に簡素化します。このツールの商品再現度は非常に高く、生成された動画の品質は商業基準に達しており、中小規模の販売者が市場競争で優位に立つのに役立ちます。
【AiBase要約:】
🖼️ 商品画像をアップロードするだけで、Product Anyshootは高品質な展示動画をインテリジェントに生成し、制作プロセスを大幅に簡素化します。
⚙️ このツールには5000を超える事前作成されたテンプレートが組み込まれており、ユーザーはカスタマイズして個々の表示ニーズを満たすことができます。
📈 生成された動画の滑らかさとリアルさは商業基準に達しており、中小規模の販売者の競争力の向上に役立ちます。
詳細リンク:https://top.aibase.com/tool/product-anyshoot
6、美图WHEEが新しい「証明写真」機能をリリース
WHEEが発表した新しい「証明写真」機能は、ユーザーに便利な証明写真作成エクスペリエンスを提供することを目的としています。ユーザーはモバイルアプリを通じて、わずか5分間で高品質の証明写真を生成でき、従来の写真館の多くの不便さを解消します。この機能はさまざまなサイズに対応しており、ユーザーがさまざまな場面で適切な証明写真を使用できることを保証し、また、痛みのない顔と衣装の交換機能を備えており、背景や服装のスタイルを簡単に切り替えることができ、ユーザーの個々のニーズを満たします。
【AiBase要約:】
📏 証明写真機能はさまざまなサイズに対応しており、ユーザーはサイズを心配する必要がなく、さまざまな場面に適しています。
✨ 痛みのない顔と衣装の交換機能を備えており、ユーザーは背景と服装を簡単に切り替えて、さまざまなスタイルを表現できます。
🌟 多様なイメージ写真機能により、ユーザーはイメージの変更を迅速に完了し、個々のニーズを満たすことができます。
7、テンセントクラウドがDeepSeek最新版V3モデルAPIインターフェースのリリースを発表
テンセントクラウドは3月25日夜、DeepSeek-V3-0324バージョンモデルのAPIインターフェースを発表し、企業や開発者がこのモデルを直接呼び出して、安定した高品質なサービスを提供できるようにしました。新バージョンは推論タスク、プログラミング能力、中国語のライティングなどで顕著な改善が見られ、特に数学とコードの評価においてGPT-4.5を上回っています。
【AiBase要約:】
🛠️ 新版DeepSeek-V3モデルは強化学習技術によって推論タスクのパフォーマンスが向上し、特に数学とコードの評価においてGPT-4.5を上回っています。
💻 プログラミング能力が大幅に向上し、生成されたHTMLコードの可用性と視覚効果が向上し、開発者はその能力がClaude 3.5/3.7 Sonnetと匹敵すると考えています。
✍️ 中国語のライティングにおいて、中長文の創作品質が最適化され、オンライン検索シナリオではより詳細で正確な結果が出力されます。
詳細リンク:https://cloud.tencent.com/document/product/1772/115963
8、清華大学がVideo-T1をオープンソース化:AI動画を再トレーニングすることなく、瞬時に高精細な大作に変換
清華大学研究チームはVideo-T1技術をオープンソース化しました。テスト時スケーリング(TTS)戦略を利用して、動画生成の品質とテキストの一貫性を大幅に向上させています。この方法は、推論段階で計算リソースを増やすことで、高価なモデルの再トレーニングを回避し、動画生成の新たな可能性を示しています。実験によると、TTSはモデルのパフォーマンスを継続的に向上させ、特に画像の品質とシーンの説明の適合性において顕著な進歩を遂げています。
【AiBase要約:】
🎯 TTS戦略は推論計算リソースを増やすことで、動画生成の品質と一貫性を大幅に向上させています。
🔍 Video-T1はランダム線形探索とフレームツリー探索戦略を採用し、候補動画の生成と評価プロセスを最適化しています。
📈 実験結果によると、TTSは複数の動画生成モデルでパフォーマンスを安定的に向上させ、特に画像の品質とシーンの説明の適合性において顕著な進歩を遂げています。
詳細リンク:https://top.aibase.com/tool/video-t1
9、AppleがAppleマップの「Look Around」写真を用いてAIモデルをトレーニング
Appleは最近、2025年3月から「Look Around」機能で収集した画像を人工知能モデルのトレーニングに利用すると発表しました。これらのモデルは、画像認識や創作などの技術に適用されます。Appleはデータ収集時にユーザーのプライバシーを保護することを約束しており、すべての画像はぼかし処理されています。ユーザーが自宅の画像をぼかし処理してほしい場合は、リクエストすることができます。
【AiBase要約:】
🌍 Appleは2025年3月から「Look Around」画像を使用して人工知能モデルをトレーニングします。
📷 画像収集において、Appleはユーザーのプライバシーを保護し、顔とナンバープレートをぼかし処理することを約束しています。
🖼️ Appleの多くの機能は、写真アプリのクリーンアップツールなど、人工知能画像生成モデルによって駆動されています。
10、BMWがアリババとAI協業を発表、通義大モデルが車載される
BMWグループとアリババグループは中国市場で戦略的提携を結び、人工知能の大規模言語モデルとインテリジェント音声対話技術に焦点を当てています。アリババの通義大モデルはBMWの次世代モデルに搭載され、インテリジェントな対話エクスペリエンスが向上します。BMWの360度全チェーンAI戦略は生産プロセスを最適化し、インテリジェントカー製造をサポートし、2026年に新型車を量産する計画で、AIインテリジェントパーソナルアシスタントを強化し、自然でスムーズなユーザーインタラクションエクスペリエンスを実現します。
【AiBase要約:】
🤝 BMWとアリババは戦略的提携を結び、中国のユーザーニーズに合わせたAIソリューションを共同開発します。
🚀 アリババの通義大モデルは、BMWの新型車にインテリジェント化アップグレードの技術サポートを提供します。
🛠️ BMWは2026年に次世代モデルを量産する計画で、初めてAI大規模言語モデルを導入し、ユーザーインタラクションエクスペリエンスを向上させます。