智源研究院は、大規模言語モデル開発者向けに、低コストで継続的に性能を向上させるためのLM-Cocktailモデルガバナンス戦略を発表しました。
この戦略は、複数のモデルを融合することで、目標タスクにおける性能向上と汎用能力の維持を両立します。LM-Cocktailの高い柔軟性と効率性により、大規模言語モデル開発者にとって低コストで実現可能な選択肢を提供します。
智源研究院は、大規模言語モデル開発者向けに、低コストで継続的に性能を向上させるためのLM-Cocktailモデルガバナンス戦略を発表しました。
この戦略は、複数のモデルを融合することで、目標タスクにおける性能向上と汎用能力の維持を両立します。LM-Cocktailの高い柔軟性と効率性により、大規模言語モデル開発者にとって低コストで実現可能な選択肢を提供します。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
4月10日に行われた商湯テクノロジー交流会において、商湯科技は最新のマルチモーダル融合大規模言語モデル「商湯日日新SenseNova V6」と「商湯大装置SenseCore2.0」システムを発表しました。この新型大規模言語モデルは、テキスト、画像、ビデオなど様々な情報形式を統合し、より自然で豊かなインタラクション体験を提供することを目指しています。今回発表されたSenseNova V6シリーズには4つのバージョンが含まれており、中でもSenseNova V6Proが注目を集めています。
先日、宜人智科(米国株コード:YRD)は、独自開発の智語大規模言語モデルが、『生成式人工知能サービス管理暫行辦法』の規定に従い、正式に备案を完了したことを発表しました。このニュースは、宜人智科がAI技術のコンプライアンスにおいて重要な一歩を踏み出したことを示しており、金融分野におけるインテリジェントなアプリケーションの基盤を固めるものです。中国を代表するAI駆動型金融サービスプロバイダーとして、宜人智科は技術革新を通じて業界の変革を推進しています。画像出典:AI生成画像、画像ライセンス提供元Midjour
プログラム開発の世界において、バグ修正は常に悩みの種です。この度、バイトダンスのDoubao大規模言語モデルチームは朗報をもたらしました。同チームは、初の多言語ソフトウェアエンジニアリング(SWE)データセットであるMulti-SWE-benchを正式に発表しました。この新しいデータセットは、大規模言語モデルによるコードバグの自動修正能力を評価・向上させることを目的としています。Multi-SWE-benchは従来の単一言語データセットと比較して、適用範囲を大幅に拡大しています。このデータセットはPythonだけでなく、
最近、アップル社の人工知能分野における新たな動きが注目を集めています。ブルームバーグのマーク・ガーマン記者による最新の報道によると、アップルは間もなくリリースされるiOS 19システムにおいて、同社の「Apple Intelligence」人工知能技術の適用範囲を大幅に拡大する計画です。このニュースは、アップルの将来のAI戦略に対し、業界関係者の期待を高めています。情報によると、アップルはサードパーティの開発者に対し、サマリー生成APIインターフェースを公開する予定です。これは、ユーザーが複数の場面でAIによる恩恵を受けられることを意味します。
京東零售の技術チームは、自社開発による初の10億規模の販売予測時系列大規模言語モデルTimeHFを発表しました。このモデルは、人間のフィードバックによる強化学習技術(RLHF)に基づいており、販売予測分野への応用は初めてです。予測精度は10%以上向上し、需要予測における不確実性を大幅に削減しました。この成果は、京東内部の2万種類の商品における自動補充のシナリオで優れた成果を上げています。
医療技術の進歩を続ける中、ユナイテッド・イメージングは4月9日、最新の医療大規模言語モデル「元智」を発表しました。この大規模言語モデルの発表は、医療業界に新たな機会をもたらすだけでなく、医師と患者によりスマートなサービスを提供します。ユナイテッド・イメージングの「元智」は、数千万件の医療画像データと数十万件の正確なアノテーションデータに基づいており、画像診断の効率と精度を向上させることを目的としています。「元智」は10種類以上の画像モダリティをサポートし、300種類以上の画像処理タスクを処理できます。これは、
中国の注目を集める人工知能研究機関DeepSeek AIは、強力なオープンソース言語モデルDeepSeek-R1に続き、大規模言語モデル(LLM)分野で再び大きな進歩を遂げました。最近、DeepSeek AIは、より汎用的で拡張性の高いAI報酬モデル(Reward Models)を構築することを目的とした、自己主導原則の批判的調整(Self-Principled Critique Tuning、略してSPCT)という革新的な技術を発表しました。
先日、世界的なチップおよびAI技術大手NVIDIA(エヌビディア)が、新たなオープンソースの大規模言語モデルであるLlama 3.1 Nemotron Ultra 253Bを発表し、人工知能分野で大きな反響を呼びました。このモデルはMetaのLlama-3.1-405Bをベースに、革新的な技術で最適化されており、Llama 4 BehemothやMaverickなどの強力な競合製品を性能面で凌駕するだけでなく、効率的なリソース利用率と卓越したマルチタスク能力により、A…