淘天グループと愛橙科技が巨大言語モデル訓練フレームワークMegatron-LLaMAをオープンソース化

机器之心

公開日AIニュース · 1 分で読めます · Sep 13, 2023

淘天グループと愛橙科技は、大規模言語モデルのトレーニング性能向上、トレーニングコスト削減、そしてLLaMAコミュニティとの互換性を目的とした大規模モデルトレーニングフレームワーク「Megatron-LLaMA」をオープンソース化しました。このフレームワークは、32枚のGPUを用いたトレーニングにおいて176%の高速化を実現し、ネットワーク不安定性に対しても高い耐性を示します。Megatron-LLaMAは、最適な設定の自動選択、モデル構造変更への対応、そして様々なハードウェア環境下での最高性能トレーニングソリューションに焦点を当てています。

大規模言語モデル訓練フレームワーク Megatron-LLaMA

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

銀行のテクノロジー変革が加速、大規模言語モデルがコア業務に浸透

デジタル化における課題と圧力が銀行業界で増す中、多くの銀行が、単純なチャットボットの応用にとどまらず、大規模言語モデル技術をコア業務に統合し始めています。最新の決算データによると、国内の主要銀行の一部は、テクノロジー投資と大規模言語モデルの活用において顕著な進展を見せていますが、投資の二極化傾向も明らかになっています。钛媒体Appによる主要10行（6大国有銀行と数行の株式商業銀行を含む）の分析によると、6行でテクノロジー投資の縮小が見られました。例えば…

Apr 18, 2025

華晨宝马とバイトダンス火山引擎が提携、AIによる自動車マーケティング推進

先日、華晨宝马領悦デジタル情報技術有限公司（領悦）とバイトダンス傘下の火山引擎が提携を発表しました。両社は人工知能（AI）技術を活用し、革新的な自動車マーケティングサービスを提供します。今回の提携により、AI技術を用いた正確な製品マッチングと購入アドバイス、コンテンツ誘導の最適化を実現し、ユーザーの購入体験とディーラーの運営効率を向上させます。BMWグループ大中華区プレジデントの高翔氏は、AIがBMWがよりスマートで心温まるモビリティソリューションを生み出すための鍵であり、研究開発、生産、サプライチェーン、製品、サービス、運営のあらゆる分野への統合を加速させていると述べています。

Apr 18, 2025

ChatGPTだけじゃない！OpenAIが密かに公開した『エージェント構築実践ガイド』でAIエージェント作成をマスターしよう

OpenAIが最近ひっそりと公開した『エージェント構築実践ガイド』(A practical guide to building agents)は、まさにAIワーカー育成マニュアル！この記事では、分かりやすく、楽しく、この公式ガイドの内容を徹底解説します。あなたも簡単にオリジナルのAIエージェントを作成できるようになります！準備はいいですか？出発進行！…ちょっと待って、そもそもエージェントって何？

Apr 18, 2025

AIベンチマークプラットフォームChatbot Arena、新会社設立

Apr 18, 2025

OpenAIがインテリジェントエージェント構築の実践ガイド（実用的なドキュメントとリソース付き）を公開

Apr 18, 2025

LMArenaが正式に会社設立 AIの中立的な評価プラットフォームを提供

Apr 18, 2025

360織語が正式に360智語にアップグレード、スーパーインテリジェントアシスタント「智小語」も発表

360数智化集団のプロダクトディレクターである廖百成氏によると、360智語は「2つの基盤＋5つの能力」という製品アーキテクチャを採用しています。そのうち、人工知能サービス基盤は、大規模言語モデルのライフサイクル全体を管理し、モデルの専門性を確保します。一方、通信接続基盤は、メッセージ、アプリケーション、ポータル、会議、ドキュメントなどの協調機能を統合的に集約し、インテリジェントな協調インタラクションのためのスーパーエントリを構築します。

Apr 18, 2025

アジアの台頭：DeepSeek、巨額投資、データセンターがAI競争力を後押し

今年のダボス世界経済フォーラムでは、多くのビジネスリーダーや政治リーダーが集まり、米国テクノロジー大手の人工知能（AI）分野における支配的な地位を認め、中国を含むアジア全体がその分野で遅れを取っていると広く考えられていました。しかし、参加者たちが去った後、この見方は疑問視され始めました。まず、中国の無名のヘッジファンドであるDeepSeek（深度寻求）が世界的な注目を集めました。同社のAI部門は、R1という大規模言語モデルを発表しました。

Apr 18, 2025

マイクロソフト、新型言語モデルBitNet b1.58 2B4Tを発表 - わずか0.4GBのメモリ使用量

Apr 18, 2025

上海人工知能研究所、アップグレード版マルチモーダル大規模言語モデル「書生・万象 3.0」を発表

Apr 17, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

淘天グループと愛橙科技が巨大言語モデル訓練フレームワークMegatron-LLaMAをオープンソース化

机器之心

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

銀行のテクノロジー変革が加速、大規模言語モデルがコア業務に浸透

華晨宝马とバイトダンス火山引擎が提携、AIによる自動車マーケティング推進

ChatGPTだけじゃない！OpenAIが密かに公開した『エージェント構築実践ガイド』でAIエージェント作成をマスターしよう

AIベンチマークプラットフォームChatbot Arena、新会社設立

OpenAIがインテリジェントエージェント構築の実践ガイド（実用的なドキュメントとリソース付き）を公開

LMArenaが正式に会社設立 AIの中立的な評価プラットフォームを提供

360織語が正式に360智語にアップグレード、スーパーインテリジェントアシスタント「智小語」も発表

アジアの台頭：DeepSeek、巨額投資、データセンターがAI競争力を後押し

マイクロソフト、新型言語モデルBitNet b1.58 2B4Tを発表 - わずか0.4GBのメモリ使用量

上海人工知能研究所、アップグレード版マルチモーダル大規模言語モデル「書生・万象 3.0」を発表