AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

llm-datasets

大規模言語モデルのファインチューニングに使用する、高品質なデータセット、ツール、概念集です。

一般製品プログラミングLLMデータセット

ウェブサイトを開く

mlabonne/llm-datasets は、大規模言語モデル（LLM）のファインチューニングに焦点を当てた、高品質なデータセットとツールの集まりです。研究者や開発者向けに、厳選され最適化されたデータセットを提供し、言語モデルのトレーニングと最適化を支援します。主な利点として、データセットの多様性と高品質が挙げられ、様々な使用事例をカバーすることで、モデルの汎化能力と精度が向上します。さらに、データセットの理解と活用を支援するツールと概念も提供しています。背景としては、mlabonne氏によって作成・保守されており、LLM分野の発展を目指しています。

llm-datasets

ウェブサイトを開く

llm-datasets 最新のトラフィック状況

月間総訪問数

521149929

直帰率

35.96%

平均ページ/訪問

6.1

平均訪問時間

00:06:29

llm-datasets 訪問数の傾向

llm-datasets 訪問地理的分布

llm-datasets トラフィックソース

llm-datasets 代替品

llm-datasets — 大規模言語モデルのファインチューニングに使用する、高品質なデータセット、ツール、概念集です。

プログラミング

•LLM•データセット

Tülu 3 — オープンソースの先進的な言語モデルファインチューニングフレームワーク

国際セレクション

•言語モデル•ファインチューニング

WorkflowLLM — データ駆動型のフレームワーク。大規模言語モデルのワークフローオーケストレーション能力を強化します。

プログラミング

•大規模言語モデル•ワークフローオーケストレーション

Data-Juicer — 大規模言語モデル向けの高品質データを提供する、ワンストップデータ処理システムです。

•機械学習•データサイエンス

LLMマスターコース — 実践者主導のLLM公開講座

•LLM•教育

LazyLLM — 低コードで多エージェント大規模言語モデルアプリケーションを構築するための開発ツール

プログラミング

•フレームワーク•深層学習

llama-recipes — Meta Llamaモデルのファインチューニングのためのライブラリとサンプルスクリプトの集合です。

プログラミング

•Python•機械学習

LLM Spark — LLMアプリケーション開発プラットフォーム

プログラミング

•LLM•開発プラットフォーム

mcp-use — mcp-use は MCP ツールと対話するための最も簡単な方法であり、カスタムエージェントをサポートします。

•オープンソース•MCP

Basic Memory — LLMとの対話を通じて永続的な知識を構築し、ローカルのMarkdownファイルに保存します。

•知識管理•LLM

openai-agents-python — Ein leichtgewichtiges und leistungsstarkes Framework für Multi-Agenten-Workflows

プログラミング

•Künstliche Intelligenz•Multi-Agenten

Awesome-LLM-Post-training — Um repositório de recursos de tutoriais, pesquisas e guias sobre métodos de pós-treinamento de modelos de linguagem de grande porte (LLMs).

•LLM•Pós-treinamento

l1m — LLMをベースとした、テキストと画像から構造化データを抽出するためのプロキシAPIです。

プログラミング

•データ抽出•LLM

Firecrawl LLMs.txt ジェネレーター — LLMのトレーニングと推論のために、ウェブサイトを統合したテキストファイルを生成するツール

•LLM•テキスト生成

Hugo Translator — LLMベースの記事翻訳ツール。多言語Markdownファイルを自動翻訳して作成します。

•LLM•翻訳

Aviator Agents — LLMベースのエージェントフレームワークで、コードリポジトリで大規模なコード移行を実行するために使用されます。

プログラミング

•コード移行•LLM

Level-Navi Agent-Search — Level-Navi Agentは、トレーニングなしで使用できるフレームワークであり、大規模言語モデルを使用して、深層クエリ理解と正確な検索を実行します。

プログラミング

•大規模言語モデル•ウェブ検索

llm-commit — Ein Plugin zur Generierung von Git-Commit-Nachrichten mit LLM

プログラミング

Signs — 人工知能を活用してアメリカ手話（ASL）の学習と貢献を支援するプラットフォームです。

国際セレクション

•人工知能•手話学習

Crawl4LLM — LLM事前学習のための効率的なウェブクローラーツール。高品質なウェブデータの効率的な収集に特化しています。

プログラミング

•LLM•ウェブクローラー

幻覚リーダーボード — 大型言語モデルが短い文書を要約する際に生じる幻覚を比較するためのランキングです。

•LLM•幻覚検出

VisionAgent — VisionAgentは、ビジョンタスクを解決するためのコードを生成するライブラリです。複数のLLMプロバイダーに対応しています。

•人工知能•ビジョンタスク

OmniParser V2 — OmniParser V2は、あらゆるLLMをコンピュータで使用可能なエージェントに変換する技術です。

国際セレクション

•人工知能•GUI自動化

Supametas.AI — 非構造化データ処理プラットフォーム。企業が業界データセットを迅速に構築し、LLM RAGナレッジベースに統合することを支援します。

•データ処理•LLM

stocks-insights-Ai-agent — LLMとLangChainを用いたフルスタックアプリケーション。株式データとニュースの検索に利用できます。

•LLM•LangChain

Dolphin R1 — Dolphin R1は、推論モデルのトレーニングに使用される80万サンプルを含むデータセットです。

プログラミング

•自然言語処理•推論モデル

OpenDeepResearcher — AIを活用した深度研究ツール。ユーザーの検索要求が満たされるまで継続的に情報を検索します。

プログラミング

•研究ツール•反復検索

Flex.1-alpha — 80億パラメータを持つ、Apache 2.0オープンソースライセンスのテキストから画像を生成する事前学習済みモデルです。

•テキストから画像生成•深層学習

DocETL — LLM駆動型データ処理システムです。

•データ処理•LLM

DocWrangler — LLMベースのデータ処理パイプラインの構築と最適化を目的とした、オープンソースのインタラクティブ開発環境です。

•LLM•データ処理