AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

Together AI、大規模言語モデル訓練用RedPajama v2データセットを発表

站长之家

公開日AIニュース · 1 分で読めます · Nov 6, 2023

RedPajama v2データセット公開

Together AIは、大規模言語モデルのトレーニングに使用できる30兆トークンを含むRedPajama v2データセットを公開しました。

このデータセットは、大規模言語モデルの開発を支援し、高品質なデータリソースを提供することを目的としています。Common Crawlやその他の公開ウェブデータから収集されており、40以上の品質注釈と重複除去クラスタが含まれています。

RedPajama v2データセットは最小限の処理しか行われておらず、元のデータが保持されているため、モデル開発者は後処理を行うことができます。

この取り組みは、言語モデルの開発と研究に多くのリソースを提供し、AI分野の更なる発展に貢献すると期待されています。

AIデータセット大規模言語モデル Together AI

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

商湯科技、新たなマルチモーダル大規模言語モデルを発表未来のインタラクション時代に向けた布石

4月10日に行われた商湯テクノロジー交流会において、商湯科技は最新のマルチモーダル融合大規模言語モデル「商湯日日新SenseNova V6」と「商湯大装置SenseCore2.0」システムを発表しました。この新型大規模言語モデルは、テキスト、画像、ビデオなど様々な情報形式を統合し、より自然で豊かなインタラクション体験を提供することを目指しています。今回発表されたSenseNova V6シリーズには4つのバージョンが含まれており、中でもSenseNova V6Proが注目を集めています。

Apr 10, 2025

宜人智科の智語大規模言語モデルが备案成功：コンプライアンスにおいて重要な一歩を踏み出し、AIが金融の未来を拓く

先日、宜人智科（米国株コード：YRD）は、独自開発の智語大規模言語モデルが、『生成式人工知能サービス管理暫行辦法』の規定に従い、正式に备案を完了したことを発表しました。このニュースは、宜人智科がAI技術のコンプライアンスにおいて重要な一歩を踏み出したことを示しており、金融分野におけるインテリジェントなアプリケーションの基盤を固めるものです。中国を代表するAI駆動型金融サービスプロバイダーとして、宜人智科は技術革新を通じて業界の変革を推進しています。画像出典：AI生成画像、画像ライセンス提供元Midjour

Apr 10, 2025

バイトダンスがMulti-SWE-benchを発表、多言語コードの自動修正に新基準を確立

プログラム開発の世界において、バグ修正は常に悩みの種です。この度、バイトダンスのDoubao大規模言語モデルチームは朗報をもたらしました。同チームは、初の多言語ソフトウェアエンジニアリング（SWE）データセットであるMulti-SWE-benchを正式に発表しました。この新しいデータセットは、大規模言語モデルによるコードバグの自動修正能力を評価・向上させることを目的としています。Multi-SWE-benchは従来の単一言語データセットと比較して、適用範囲を大幅に拡大しています。このデータセットはPythonだけでなく、

Apr 10, 2025

バイトダンス、大規模言語モデルコードインテリジェントアップグレード推進のためMulti-SWE-benchをオープンソース化

Apr 10, 2025

アップルiOS 19のAI機能が明らかに：サマリー機能強化、通知管理のスマート化

最近、アップル社の人工知能分野における新たな動きが注目を集めています。ブルームバーグのマーク・ガーマン記者による最新の報道によると、アップルは間もなくリリースされるiOS 19システムにおいて、同社の「Apple Intelligence」人工知能技術の適用範囲を大幅に拡大する計画です。このニュースは、アップルの将来のAI戦略に対し、業界関係者の期待を高めています。情報によると、アップルはサードパーティの開発者に対し、サマリー生成APIインターフェースを公開する予定です。これは、ユーザーが複数の場面でAIによる恩恵を受けられることを意味します。

Apr 10, 2025

京東零售、初の自社開発10億規模の時系列大規模言語モデルTimeHFを発表商品販売量の予測が可能に

京東零售の技術チームは、自社開発による初の10億規模の販売予測時系列大規模言語モデルTimeHFを発表しました。このモデルは、人間のフィードバックによる強化学習技術（RLHF）に基づいており、販売予測分野への応用は初めてです。予測精度は10％以上向上し、需要予測における不確実性を大幅に削減しました。この成果は、京東内部の2万種類の商品における自動補充のシナリオで優れた成果を上げています。

Apr 10, 2025

ユナイテッド・イメージング、医療大規模言語モデル「元智」を発表　画像診断とスマート医療サービスを支援

医療技術の進歩を続ける中、ユナイテッド・イメージングは4月9日、最新の医療大規模言語モデル「元智」を発表しました。この大規模言語モデルの発表は、医療業界に新たな機会をもたらすだけでなく、医師と患者によりスマートなサービスを提供します。ユナイテッド・イメージングの「元智」は、数千万件の医療画像データと数十万件の正確なアノテーションデータに基づいており、画像診断の効率と精度を向上させることを目的としています。「元智」は10種類以上の画像モダリティをサポートし、300種類以上の画像処理タスクを処理できます。これは、

Apr 9, 2025

推論性能が飛躍的に向上！DeepSeekが革新的技術SPCTを発表、大規模モデルがより人間を理解

中国の注目を集める人工知能研究機関DeepSeek AIは、強力なオープンソース言語モデルDeepSeek-R1に続き、大規模言語モデル(LLM)分野で再び大きな進歩を遂げました。最近、DeepSeek AIは、より汎用的で拡張性の高いAI報酬モデル(Reward Models)を構築することを目的とした、自己主導原則の批判的調整(Self-Principled Critique Tuning、略してSPCT)という革新的な技術を発表しました。

Apr 9, 2025

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表 - Llama 4 Behemothを凌駕する性能

Apr 9, 2025

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：AI性能の王者、業界の新たなベンチマークを定義

先日、世界的なチップおよびAI技術大手NVIDIA（エヌビディア）が、新たなオープンソースの大規模言語モデルであるLlama 3.1 Nemotron Ultra 253Bを発表し、人工知能分野で大きな反響を呼びました。このモデルはMetaのLlama-3.1-405Bをベースに、革新的な技術で最適化されており、Llama 4 BehemothやMaverickなどの強力な競合製品を性能面で凌駕するだけでなく、効率的なリソース利用率と卓越したマルチタスク能力により、A…

Apr 9, 2025

AIニュース

AIデイリー

AIタイムライン

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

Together AI、大規模言語モデル訓練用RedPajama v2データセットを発表

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

商湯科技、新たなマルチモーダル大規模言語モデルを発表 未来のインタラクション時代に向けた布石

宜人智科の智語大規模言語モデルが备案成功：コンプライアンスにおいて重要な一歩を踏み出し、AIが金融の未来を拓く

バイトダンスがMulti-SWE-benchを発表、多言語コードの自動修正に新基準を確立

バイトダンス、大規模言語モデルコードインテリジェントアップグレード推進のためMulti-SWE-benchをオープンソース化

アップルiOS 19のAI機能が明らかに：サマリー機能強化、通知管理のスマート化

京東零售、初の自社開発10億規模の時系列大規模言語モデルTimeHFを発表 商品販売量の予測が可能に

ユナイテッド・イメージング、医療大規模言語モデル「元智」を発表 画像診断とスマート医療サービスを支援

推論性能が飛躍的に向上！DeepSeekが革新的技術SPCTを発表、大規模モデルがより人間を理解

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表 - Llama 4 Behemothを凌駕する性能

NVIDIA、Llama 3.1 Nemotron Ultra 253Bを発表：AI性能の王者、業界の新たなベンチマークを定義

商湯科技、新たなマルチモーダル大規模言語モデルを発表未来のインタラクション時代に向けた布石

京東零售、初の自社開発10億規模の時系列大規模言語モデルTimeHFを発表商品販売量の予測が可能に

ユナイテッド・イメージング、医療大規模言語モデル「元智」を発表　画像診断とスマート医療サービスを支援