LLM360計画が全面的にオープンソース化され、70億パラメーターのLLMであるAMBERとCRYSTALCODERの2つが公開されました。
本研究では、オープンソースLLMの重要性を強調し、AMBERモデルの4つのデータセットにおける事前学習性能を示すことで、世界的なオープンソース大規模言語モデルの透明性イニシアチブを推進しています。
LLM360計画が全面的にオープンソース化され、70億パラメーターのLLMであるAMBERとCRYSTALCODERの2つが公開されました。
本研究では、オープンソースLLMの重要性を強調し、AMBERモデルの4つのデータセットにおける事前学習性能を示すことで、世界的なオープンソース大規模言語モデルの透明性イニシアチブを推進しています。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
餓了麼は、国内初のAI大規模言語モデル技術に基づく配達員向けインテリジェントアシスタント「小餓」の正式提供を発表しました。AI技術によって配達員の業務環境を再構築し、業務効率と安全性の向上を両立します。この機能は、無錫、瀋陽、佛山、蘇州の4都市で先行して開始され、蜂鳥衆包アプリを利用する配達員を対象としています。
先日、飛書と生数科技は戦略的パートナーシップを締結し、国産ビデオ大規模言語モデルであるViduを飛書的多次元表機能に正式に統合しました。これにより、飛書ユーザーは、多次元表内のAIフィールドショートカットを通じて、Viduビデオ大規模言語モデルを簡単に呼び出し、作業効率の向上とデータ処理能力の強化を実現できます。生数科技のViduは、強力な機能を備えたビデオ大規模言語モデルであり、効率的なビデオ生成と処理を実現します。今回の連携は、飛書ユーザーがAI技術をより便利に活用し、視覚的な…
バイトダンス傘下の火山エンジンは、最新リリースの豆包1.5・深層思考モデルがエッジ大規模言語モデルゲートウェイに全面的に上线されたことを発表し、ユーザーに最大500万トークンの無料利用枠を提供しています。この取り組みはAI業界で大きな注目を集めています。
4月25日に開催された百度Create開発者会議で、百度創設者である李彦宏氏が最新の文心大模型シリーズである文心4.5 TurboとX1 Turboを発表しました。これらの新型モデルは速度とコストの面で大幅な最適化が図られており、百度の人工知能分野における更なる進歩を示しています。文心4.5Turboは以前のバージョンと比較して速度が大幅に向上し、処理効率が高まり、価格はなんと80%も削減されました。具体的には、100万トークンあたり…
GitHub上で「system-prompts-and-models-of-ai-tools」というオープンソースプロジェクトが大きな注目を集め、30.5Kスターを獲得し、AI開発者や研究者にとって貴重なリソースとなっています。AIbaseの調査によると、このプロジェクトは9つの主要なAIツールのシステムプロンプトとモデル設定を網羅しており、6500行以上の内容を含み、v0、Cursor、Manus、Same.dev、Lovable、Devin、Repなどをカバーしています。
最新の上海モーターショーで、卓馭科技(卓馭と略称)は阿里通義大模型への接続に成功したと発表しました。これは、インテリジェント運転分野における重要な進歩を示しています。インテリジェント運転のサプライヤー兼サービスプロバイダーとして、卓馭は阿里雲の強力なコンピューティング能力を活用し、エンドツーエンドのインテリジェント運転の世界モデルの構築を目指し、自動車のインテリジェンスレベルの向上に努めています。近年、インテリジェント運転技術は急速に発展しており、主要な自動車メーカーはこぞってこの分野への投資を拡大しています。卓馭科技は、阿里通義大模型との連携において、すでに…
ステップスターとゲンリキ・インテリジェンスは北京において戦略的提携契約を締結しました。両社はそれぞれの技術的優位性を活かし、マルチモーダル大規模言語モデル技術、インテリジェントターミナルエージェント、エンボディッドAIのシナリオにおいて緊密な協力を展開します。今回の提携の目標は「物理世界における推論の実現」であり、共同で「RoboAgent」と呼ばれるインテリジェントロボットを開発し、汎用人工知能(AGI)の現実世界への応用を推進することです。調印式には、ステップスターの創業者兼CEOである姜大昕博士とゲンリキ・インテリジェンスの共同創業者が出席しました。
智譜BigModelオープンソースプラットフォームによる今回の価格改定は、複数のモデル製品に影響します。中でも、GLM-4-FlashXモデルは、1億トークンあたりわずか10元で提供されます。このモデルは強力な事前学習基盤に基づいており、超高速な推論速度と、GPT-4に匹敵する機能呼び出し能力を備えています。データ抽出、生成、翻訳などにおいて優れた性能を発揮します。