vivoは開発者会議で、独自開発の汎用大規模言語モデル「藍心大模型」を発表しました。開発費用は20~30億元(数千億円規模)を投じ、10億、100億、1000億という3つのパラメーター規模を備えています。
そのうち、70億パラメーターのモデルはスマートフォン向けで、対話、知識質問応答、意図理解などの機能を備えています。一方、700億パラメーターのモデルはクラウドサービス向けで、ロールプレイング、知識質問応答、自然な対話などの機能を備えています。
vivoは開発者会議で、独自開発の汎用大規模言語モデル「藍心大模型」を発表しました。開発費用は20~30億元(数千億円規模)を投じ、10億、100億、1000億という3つのパラメーター規模を備えています。
そのうち、70億パラメーターのモデルはスマートフォン向けで、対話、知識質問応答、意図理解などの機能を備えています。一方、700億パラメーターのモデルはクラウドサービス向けで、ロールプレイング、知識質問応答、自然な対話などの機能を備えています。
バイトダンス傘下の豆包大規模言語モデルチームは先日、混合専門家モデル(MoE)アーキテクチャにおける主要なボトルネックを克服し、COMETという名称の重要な最適化技術をオープンソース化したと発表しました。この技術は、大規模言語モデルのトレーニング効率を大幅に向上させ、最大1.7倍の効率向上を実現し、トレーニングコストを40%削減することに成功しました。画像注記:画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを使用しています。COMET技術は、バイトダンスの万規模GPUクラスタトレーニングで実際に適用されており、数百万GPU時間の節約に貢献しています。
3月10日、智元ロボットは、初の汎用具象ベースの大規模言語モデルであるGenie Operator-1(GO-1と略称)を発表しました。この発表は大きな注目を集め、特に家庭用サービスロボットの可能性という点において、将来の家事管理に新たな希望をもたらすものとして期待されています。智元ロボットの公式発表によると、GO-1大規模言語モデルは大量の人間のビデオ学習を通じて、コップの水を運ぶ、食事を作る、客を迎えるなど、多くの家事タスクをこなす優れた能力を示しています。技術性能に関しては、
報道によると、国家スパコンインターネットプラットフォームは阿里巴巴の通義千問大規模言語モデルへの接続を発表し、千問QwQ-32B APIサービスの正式提供を開始しました。本サービスを利用するユーザーは、最大100万トークンを無料で利用でき、多くの開発者や研究者にとって絶好の機会となります。千問QwQ-32Bは阿里巴巴通義チームが最近オープンソース化した推論モデルであり、優れた性能を誇ります。複数の権威ある評価データによると、千問QwQ-32Bの能力は「フルバージョン」の671Bと匹敵します。