中国の站長之家(zhanzhangzhijia)の報道によると、北京智源人工智能研究院がVision Mambaを発表しました。これは状態空間モデルを採用することで、視覚モデリングのパフォーマンスを向上させると同時に、メモリと計算効率も高めています。
このモデルは複数のタスクにおいて優れた性能を示し、従来のモデルよりも高い発展可能性を秘めていることが明らかになりました。画像分類、物体検出、セマンティックセグメンテーションといったタスクへの高い実用性を備えています。
中国の站長之家(zhanzhangzhijia)の報道によると、北京智源人工智能研究院がVision Mambaを発表しました。これは状態空間モデルを採用することで、視覚モデリングのパフォーマンスを向上させると同時に、メモリと計算効率も高めています。
このモデルは複数のタスクにおいて優れた性能を示し、従来のモデルよりも高い発展可能性を秘めていることが明らかになりました。画像分類、物体検出、セマンティックセグメンテーションといったタスクへの高い実用性を備えています。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
先日、OpenAIが発表したo3人工知能モデルのベンチマークテスト結果が、大きな論争を呼んでいます。OpenAIは昨年12月、o3モデルが非常に難しいFrontierMath数学問題集で4分の1以上の問題に正答すると自信満々に発表していましたが、最近の独立したテスト結果とは大きく食い違っています。Epoch研究所がo3モデルについて独立テストを実施したところ、その得点はわずか10%で、発表された内容をはるかに下回ることが判明しました。
AMDのAI分野における進歩は注目に値し、特にStable Diffusionモデルに対する最新の最適化は特筆すべきです。最近、Stability AIはONNXフレームワークに基づいた最適化されたStable Diffusionバージョンをリリースしました。これは、AMDのRadeonグラフィックカードとRyzen統合グラフィックスがAIタスク実行時のパフォーマンスを大幅に向上させ、最大3.8倍の高速化を実現することを意味します。この進歩は、NVIDIAとのエコシステムにおける差を縮めるだけでなく、…
バイトダンスSeedチームは、Seedream 3.0テキストから画像生成モデルの技術レポートを発表しました。このモデルは性能において大幅な向上を実現し、ネイティブの高解像度をサポートし、中国語と英語の両言語に対応した画像生成基礎モデルです。解像度、画像構造の正確性など多くの点でブレークスルーを達成し、以前のバージョンと比較して顕著な優位性を示しています。Seedream 3.0の様々な側面でのパフォーマンス。図中の各次元のデータは、最適な指標を基準として正規化されています。機能のハイライトとしては、Seedream 3.0はネイティブで…
この度、テクノロジー大手OpenAIは新興企業Context.aiチームの買収を発表しました。この買収は、同社のAIモデルの評価と分析能力を向上させることを目的としています。Context.aiは2023年に設立され、元Google社員のHenry Scott-Green氏とAlex Gamble氏が共同で創業しました。開発者向けにAIモデルのパフォーマンスに関する詳細な分析と視覚化ツールを提供することに注力しています。この動きは、OpenAIがAI技術の向上に尽力していることを示しています。
著名なAI科学者である李飛飛教授が率いるスタンフォード大学人工知能研究所が、最新の『2025年人工知能指数レポート』を発表しました。8年連続で発表されているこの権威あるレポートによると、世界で最も影響力のある2つのAI大国である中国とアメリカにおいて、トップレベルのAI大規模モデル間の性能差は大幅に縮小し、わずか0.3%となりました。これは2023年の17.5%と比較すると、無視できるほどの差です。レポートでは2024年の重要な大規模モデル(Notable Models)を選定し、
科大訊飛は上海で開催されたAI無界智営グローバル発表会で、同社の深層推論モデルである星火X1の大幅なアップグレードを発表しました。科大訊飛の上級副社長である于継棟氏によると、今回のアップグレードにより、星火X1の推論能力、テキスト生成、言語理解能力がさらに向上し、業界をリードするOpenAI o1やDeepSeek R1モデルに匹敵する性能を実現するとのことです。星火X1は2025年1月に初めて発表され、国産の計算能力によるトレーニング技術で業界の注目を集めました。
中国の注目を集める人工知能研究機関DeepSeek AIは、強力なオープンソース言語モデルDeepSeek-R1に続き、大規模言語モデル(LLM)分野で再び大きな進歩を遂げました。最近、DeepSeek AIは、より汎用的で拡張性の高いAI報酬モデル(Reward Models)を構築することを目的とした、自己主導原則の批判的調整(Self-Principled Critique Tuning、略してSPCT)という革新的な技術を発表しました。
先日、世界的なチップおよびAI技術大手NVIDIA(エヌビディア)が、新たなオープンソースの大規模言語モデルであるLlama 3.1 Nemotron Ultra 253Bを発表し、人工知能分野で大きな反響を呼びました。このモデルはMetaのLlama-3.1-405Bをベースに、革新的な技術で最適化されており、Llama 4 BehemothやMaverickなどの強力な競合製品を性能面で凌駕するだけでなく、効率的なリソース利用率と卓越したマルチタスク能力により、A…
2025年4月8日、NVIDIAはLlama-3.1-405Bを最適化して開発された、253億パラメーターのオープンソースモデルであるLlama 3.1 Nemotron Ultra 253Bを発表しました。MetaのLlama 4 BehemothやMaverickを上回り、AI分野の注目を集めています。このモデルは、GPQA-Diamond、AIME2024/25、LiveCodeBenchなどのテストで卓越した性能を示し、推論スループットはDeepSeekに匹敵します。