GPT-4を凌駕、20億パラメーターモデルが算術問題でほぼ100％の精度

学术头条

公開日AIニュース · 1 分で読めます · Sep 19, 2023

学術ニュース速報によると、清華大学、TAL AI Lab、智譜AIの研究者らが、大規模言語モデルの数学的推論能力を探るため、20億パラメーターの言語モデル「MathGLM」を開発しました。このモデルはTransformerデコーダアーキテクチャを採用し、大規模な算術データセットで訓練されており、数学演算能力が大幅に向上しています。実験結果によると、MathGLMは様々な算術演算タスクにおいて、正解率がほぼ100％に達し、GPT-4を明らかに上回っています。パラメーター数が1億しかない場合でも、GPT-4やChatGPTを凌駕しています。さらに、パラメーター数の増加に伴い、MathGLMの算術演算能力も向上することが分かりました。複雑な数字形式を含む混合算術演算においても、GPT-4やChatGPTより優れた性能を示しました。この研究は、パラメーター数とデータ量が十分であれば、言語モデルが複雑な数学演算を正確に実行できることを示唆しています。

アリババ医療大規模言語モデル、MedBench評価で2冠達成　医療AIの新時代をリード

先日、中国を代表する医療大規模言語モデル評価プラットフォームMedBenchが最新のランキングを発表しました。その中で、アリババ医療チームが開発したアリババ医療大規模言語モデルは、卓越した性能で評価ランキングと自己評価ランキングの両方で1位を獲得し、それぞれ97.5点と98.2点の高得点を記録、業界から大きな注目を集めています。アリババ医療大規模言語モデルの成功は、医療推論モデル開発におけるチームの継続的な努力の賜物です。同チームは最近、強化学習に基づく技術を採用し、次世代の医療推論モデルを開発しました。この革新により、モデルは…

シリコンベース・リキッド、新たな資金調達ラウンドを完了　美団が参入、智譜が撤退

天眼查Appによると、北京シリコンベース・リキッド科技有限公司は最近、重大な工商登記変更があった。今回の変更で、北京智譜華章科技有限公司が株主から撤退し、同時に4つの投資家が新たに加わった。美団傘下の天津三快科技有限公司、北京星連鼎森股権投資基金合夥企業（有限合夥）、南京緑涌錦航股権投資管理合夥企業（有限合夥）、中小企業発展基金普華（杭州）創業投資合夥企業（有限合夥）である。今回の資金調達後、シリコンベース・リキッドの登録資本金は約1375.8万元から変更された。

LLMs.txtジェネレーターv2リリース：ウェブサイトテキスト変換速度が10倍向上

この度、LLMs.txtジェネレーターが大幅なアップデートを行い、v2バージョンを正式にリリースいたしました。このツールは、あらゆるウェブサイトコンテンツを、AIエージェントや大規模言語モデル（LLM）で使用できるテキストファイルに迅速に変換することができ、AIアプリケーションの開発者や利用者にとって大きな利便性をもたらします。新バージョンは@firecrawl_devチームが開発し、公式llmstxtエンドポイントの全面的なサポートを受けています。前バージョンと比較して、処理速度は驚異の10倍に向上しました。LLMs.txtジェネレーターv2は…

AI大規模言語モデル業界の動向：新技術と連携の継続的な推進

人工知能の急速な発展を背景に、AI大規模言語モデルの研究開発と応用は活況を呈しています。最近、この分野における複数の企業や機関の最新動向が広く注目を集めています。まず、ChatGPTが登場する前のNVIDIAの時価総額倍率はウォール街で大きな注目を集め、専門家らは、これが2008年のアップルの成功神話を再現する兆候かもしれないと考えています。同時に、国泰君安の最高情報責任者である俞楓氏は、AI大規模言語モデルの台頭により証券業界が「インテリジェント認知」時代に入るだろうと述べています。

AIニュース

GPT-4を凌駕、20億パラメーターモデルが算術問題でほぼ100％の精度

学术头条

関連AIニュースの推奨

アリババ医療大規模言語モデル、MedBench評価で2冠達成 医療AIの新時代をリード

シリコンベース・リキッド、新たな資金調達ラウンドを完了 美団が参入、智譜が撤退

LLMs.txtジェネレーターv2リリース：ウェブサイトテキスト変換速度が10倍向上

AI大規模言語モデル業界の動向：新技術と連携の継続的な推進

アリババ医療大規模言語モデル、MedBench評価で2冠達成　医療AIの新時代をリード

シリコンベース・リキッド、新たな資金調達ラウンドを完了　美団が参入、智譜が撤退