【AI日報】へようこそ!ここは、人工知能の世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者を重視することで、技術トレンドの把握や革新的なAI製品の応用への理解を深めるお手伝いをいたします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1.智譜が漢字生成可能なオープンソースのテキスト生成画像モデルCogView4を発表
2025年3月4日、北京智譜華章科技有限公司は、漢字の生成をサポートする初のオープンソーステキスト生成画像モデルCogView4を発表しました。強力なバイリンガル入力と画像生成能力を備えています。このモデルはDPG-Benchベンチマークテストで1位を獲得し、オープンソーステキスト生成画像モデルのSOTAとなりました。任意の解像度と複雑な意味の整合性をサポートし、広告や短編動画などのニーズを満たします。
【AiBase要約:】
🎨 CogView4は、漢字の生成をサポートする初のオープンソーステキスト生成画像モデルであり、強力なバイリンガル入力能力を備えています。
🚀 DPG-Benchベンチマークテストで1位を獲得し、オープンソーステキスト生成画像モデルのSOTAとなりました。
🔧 CogView4はApache2.0ライセンスで提供され、今後エコシステムのサポートと微調整ツールキットが追加される予定です。
詳細はこちら:https://github.com/THUDM/CogView4
2.MiniMaxが新しい画像生成モデルImage-01を発表、コストは従来の1/10
MiniMaxは最近、初のテキストから画像を生成するモデルImage-01を発表し、AI画像生成技術の新たな進歩を示しました。このモデルは、優れたプロンプト制御能力とビジュアル構成能力で注目を集めており、ユーザーは論理的に一貫性があり、芸術的な画像を作成できます。さらに、Image-01の高効率バッチ処理機能と競争力のある価格により、プロフェッショナルレベルのAI創作がより容易にアクセスできるようになりました。ユーザーは、より低コストで映画レベルの品質の画像を体験でき、創造的な可能性を大きく広げることができます。
【AiBase要約:】
🌟 Image-01は、ユーザーの創造性を広げることを目的とした新しいテキストから画像を生成するモデルです。
🎨 精度の高いプロンプト制御と優れたビジュアル構成能力を備え、論理的に一貫性があり、芸術的な画像を生成できます。
💰 Image-01のサービス料金は同種の製品の10分の1であり、プロフェッショナルレベルのAI創作をより容易に利用できるようにします。
詳細はこちら:https://www.minimax.io/platform/login
3.騰訊元宝のダウンロード数がDeepSeekを上回り、Apple無料アプリダウンロードランキングで1位を獲得
騰訊元宝は、Apple中国App Storeの無料アプリダウンロードランキングで目覚ましい成果を収め、DeepSeekを上回り、ダウンロード数トップのアプリとなりました。騰訊は、プロモーションの強化と技術のアップグレードにより、元宝の認知度と魅力を高め、特に微信プラットフォームとの統合により、ユーザーエクスペリエンスが大幅に向上しました。
【AiBase要約:】
📊 騰訊元宝がDeepSeekを上回り、Apple無料アプリダウンロードランキングで1位を獲得しました。
📱 騰訊は元宝のプロモーションを強化し、特に微信プラットフォームでの露出を増やしました。
🚀 技術のアップグレードと機能の最適化が、元宝の急速な発展を支えています。
4.秘塔AI検索が「動画」検索機能を追加
2025年3月3日、上海秘塔網絡科技有限公司は、新しいAI検索機能として動画検索モジュールを追加しました。この機能は大量の動画コンテンツを分析することで、ユーザーが必要とする学習用およびエンターテイメント用の動画を効率的に見つけるのに役立ちます。ユーザーは興味のある動画を迅速に見つけることができ、検索エクスペリエンスが向上します。
【AiBase要約:】
🎥 動画検索モジュールを追加し、マルチモーダルデータに対応することで、ユーザーエクスペリエンスが向上しました。
🔍 ユーザーは、コースや広告分析など、興味のある動画コンテンツを迅速に見つけることができます。
🚀 DeepSeek R1推論モデルを導入し、検索の知能化レベルをさらに向上させました。
5.都市モデリングを革新!AIによる3D都市モデルGaussianCity、生成速度が60倍に向上!
南洋理工大学研究チームが発表したGaussianCity技術は、3D都市モデル生成分野で大きな進歩を遂げました。この技術は生成速度を60倍に向上させ、境界のない3D都市生成をサポートしており、CVPR2025に採択されました。GaussianCityは、革新的なBEV-Point表現方法と空間認識を持つガウス属性デコーダを採用することで、計算効率と拡張性を大幅に向上させています。
【AiBase要約:】
🚀 GaussianCity技術は生成速度を60倍に向上させ、従来の方法の規模の限界を打破しました。
🌆 BEV-Point表現方法を採用することで、メモリ消費量を大幅に削減し、境界のない3D都市生成を実現しました。
📈 この技術はオープンソース化されており、仮想現実、自動運転、都市計画などの分野に新たな応用可能性をもたらします。
詳細はこちら:https://github.com/hzxie/GaussianCity
6.セキュリティリスクに注意!大規模言語モデルツールOllamaに深刻な脆弱性が発見される
国家サイバーセキュリティ通報センターは最近、オープンソースのクロスプラットフォーム大規模言語モデルツールOllamaに関するセキュリティ警告を発表し、デフォルト設定で深刻なセキュリティ脆弱性が存在し、未承認アクセスやモデル窃取などのリスクにつながる可能性があると指摘しました。専門家の分析によると、特にプライベート展開のユーザーはより大きなリスクに直面しており、攻撃者はこれらの脆弱性を悪用してデータ漏洩やサービス中断などの攻撃を行う可能性があります。
【AiBase要約:】
🔍 Ollamaのセキュリティ脆弱性は、デフォルト設定では深刻であり、特にプライベート展開のユーザーのリスクは顕著です。
💻 攻撃者は未承認アクセスを利用してモデル情報の窃取やサービスの中断を行い、大きな損害を与える可能性があります。
🛡️ ユーザーはセキュリティ意識を高め、脆弱性をタイムリーに調査し、攻撃の兆候を発見した場合は関係当局に直ちに報告する必要があります。
7.超強力な動画生成モデルWan2.1 GP:低スペックGPUでも大作が作成可能!
DeepBeepMeepチームが発表したWan2.1GPは、低スペックGPUユーザー向けに最適化された動画生成モデルであり、アリババのWan2.1をベースに、高性能GPUリソースを持たないユーザーに強力な動画生成能力を提供することを目的としています。このモデルは複数のベンチマークテストで優れた性能を示し、さまざまな生成タスクをサポートし、中国語と英語のテキスト生成能力を備えており、動画生成技術の重要な進歩を示しています。
【AiBase要約:】
👍 SOTA性能:Wan2.1GPは複数のベンチマークテストで優れた性能を示し、既存のオープンソースおよび商用ソリューションを上回っています。
🖥️ 高い互換性:わずか8.19GBのVRAMで、ほとんどすべてのコンシューマー向けGPUをサポートし、低スペックユーザーにも適しています。
📜 多様なタスクに対応:テキストから動画、画像から動画など、さまざまな生成タスクをサポートし、中国語と英語のテキスト生成能力を備えています。
詳細はこちら:https://github.com/deepbeepmeep/Wan2GP
8.火山引擎が大規模言語モデルアプリケーションのオープンソース化を発表:「大規模言語モデルアプリケーションラボ」を立ち上げ、AIイノベーションの可能性を開放
火山引擎はXプラットフォームを通じて、大規模言語モデルアプリケーションの正式なオープンソース化を発表し、新しい「大規模言語モデルアプリケーションラボ」プラットフォームを発表しました。この取り組みは、AI技術エコシステム構築における大きな進歩を示しており、開発者コミュニティのイノベーションを加速することを目的としています。オープンソースアプリケーションには、モバイルアシスタント、Deep Researchなど、最先端のAIツールが含まれており、ユーザーから熱い議論を呼んでおり、火山引擎の技術的なリーダーシップを示しています。
【AiBase要約:】
📱 オープンソースアプリケーションには、モバイルアシスタント、Deep Researchなど、さまざまなAIツールが含まれており、開発者のイノベーションを促進します。
🌐 「大規模言語モデルアプリケーションラボ」が立ち上がり、開発者や研究者に対してオープンな実験環境を提供し、大規模言語モデルアプリケーションの可能性を探求します。
💬 コミュニティからの反応は熱心で、ユーザーはこの取り組みがAI開発のハードルを下げ、業界の協調とイノベーションを促進すると考えています。
9.QQブラウザが「AI作文指導」機能を発表
QQブラウザが発表した「AI作文指導」機能は、生徒の作文能力の向上を目的としており、単に解答を提供するだけではありません。この機能は、作文スキルを全過程で指導することで、生徒が着想、アウトライン、素材、例文作成の各段階で指導を受けることができます。AIツールは補助的な役割を強調しており、生徒がより多くの読書と思考を行い、作文スキルを習得することを奨励しており、単なるコピー&ペーストではありません。
【AiBase要約:】
🧠 AI作文指導機能は、生徒が作文過程で能力を高めるのに役立ち、単に解答を提供するだけではありません。
📚 この機能は、着想、アウトライン、素材、例文作成の各段階を網羅した全過程の指導を提供します。
✍️ QQブラウザは、より多くの読書と思考の重要性を強調し、生徒が作文スキルを習得することを奨励しています。
10.Anthropicが35億ドルの資金調達を実施、評価額は615億ドルに急騰
Anthropicは最近、Eシリーズの資金調達ラウンドで35億ドルを調達し、調達後の評価額は615億ドルに達しました。これは、投資家がAI市場に継続的な関心を寄せていることを示しています。今回の資金調達はLightspeed Venture Partnersが主導し、多くの著名な投資家が参加しました。調達資金は、次世代AIシステムの開発に充てられます。市場競争が激化する中、Anthropicは引き続きB2B戦略に注力し、世界中の企業に技術サポートを提供することに尽力しています。
【AiBase要約:】
💵 Anthropicが35億ドルのEシリーズ資金調達を実施し、評価額は615億ドルに達しました。これは、投資家がAI市場に継続的な関心を寄せていることを示しています。
📈 2024年の年間収益は10億ドルに達し、前年比で10倍の成長を遂げ、2025年初頭にはさらに30%の成長を記録しました。
🤝 AmazonとGoogleはそれぞれAnthropicに80億ドルと30億ドルを投資し、そのB2B戦略を支援しています。
11.コーディングから創作まで、xAI Grok-3がGPT4.5を破り、大規模言語モデル競技場で総合優勝
xAIが最近発表したGrok-3モデルは、Chatbot Arenaランキングで優れた成績を収め、わずかな差でGPT4.5-Previewを上回りました。「grok-3preview-02-24」と呼ばれるこのモデルは、コーディング、数学、創作など、複数の分野で卓越した性能を示しました。「preview」という単語が示唆するように、まだテスト段階にある可能性があり、その本番稼働性に関する議論を呼ぶ可能性があります。
【AiBase要約:】
🏆 Grok-3はChatbot ArenaでGPT4.5-Previewをわずかな差で上回り、3,000票以上を獲得し、卓越した成績を収めました。
🧠 困難なプロンプト、コーディング、数学の問題、創作など、複数の分野で優れた性能を示し、その強力な能力を示しています。
🔍 Chatbot ArenaはEloレーティングシステムを使用してモデルのランキングを作成しており、xAIのAI分野における顕著な進歩を示しています。
12.雷軍が全国人民代表大会で提案:「AI顔面交換・音声模倣」の違法・侵害行為の取り締まり強化を提案