AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

ml-ferret

正確な引用と位置特定を実現するエンドツーエンドMLLM

一般製品プログラミング機械学習言語モデル

ウェブサイトを開く

ml-ferretは、様々な形式の参照を受け入れ、マルチモーダル環境において応答性高く正確な位置特定を行うエンドツーエンドの機械学習言語モデル（MLLM）です。混合領域表現と空間認識ビジュアルサンプラーを組み合わせることで、細粒度かつオープンボキャブラリの参照と位置特定をサポートします。さらに、ml-ferretには、約110万サンプルのGRITデータセットとFerret-Bench評価ベンチマークが含まれています。

ml-ferret

ウェブサイトを開く

ml-ferret 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

ml-ferret 訪問数の傾向

ml-ferret 訪問地理的分布

ml-ferret トラフィックソース

ml-ferret 代替品

ml-ferret — 正確な引用と位置特定を実現するエンドツーエンドMLLM

プログラミング

•機械学習•言語モデル

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

国際セレクション

•人工知能•言語モデル

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Liteは、長文処理と多様なアプリケーションシナリオ向けに最適化された、高効率な言語モデルです。

•言語モデル•長文処理

DeepSeek 日本語版 — DeepSeekは、論理推論、数学、プログラミングタスクに秀でた高度なAI言語モデルです。無料で利用できます。

•言語モデル•プログラミング支援

MiniCPM-o-2_6 — MiniCPM-o 2.6は、視覚、音声、マルチモーダルライブストリーミングに適した強力なマルチモーダル大規模言語モデルです。

•マルチモーダル•言語モデル

MiniCPM-o

MiniCPM-o — MiniCPM-o 2.6：GPT-4oレベルの性能を備え、スマートフォン上でビジュアル、音声、マルチモーダルライブストリーミングを実現するMLLMです。

•マルチモーダル•言語モデル

InternVL2_5-8B-MPO — 優れた総合性能を備えたマルチモーダル大規模言語モデルです。

•マルチモーダル•大規模言語モデル

Valley 2.0 — テキスト、画像、動画データを処理する能力を向上させた、マルチモーダル大規模言語モデルです。

•マルチモーダル•大規模言語モデル

Phi-4 — 複雑な推論に特化した、マイクロソフト最新の小型言語モデルです。

国際セレクション

•機械学習•言語モデル

InternVL 2.5 — オープンソースのマルチモーダル大規模言語モデルシリーズ

•マルチモーダル•大規模言語モデル

InternVL2_5-1B — 画像とテキストの理解をサポートするマルチモーダル大規模言語モデル

•マルチモーダル•大規模言語モデル

Amazon Nova — Amazon Novaは、最先端のインテリジェンスと業界トップクラスのコストパフォーマンスを提供する、アマゾン次世代の基盤モデルです。

国際セレクション

•AWS•人工知能

OLMo-2-1124-13B-DPO — 多様なタスクに対応可能な高性能英語言語モデル

プログラミング

•言語モデル•自然言語処理

OpenScholar — 科学文献合成のための検索拡張型言語モデル

•科学文献•検索拡張

OLMo 2

OLMo 2 — 最先端、完全にオープンな言語モデル

プログラミング

•言語モデル•自然言語処理

DataChain — AI向けに設計された、最新のPythonデータフレームライブラリ。

•機械学習•人工知能

Aquila-VL-2B-llava-qwen — 画像とテキスト情報を組み合わせたインテリジェント処理を行う、ビジョン言語モデルです。

•ビジョン言語モデル•マルチモーダル

Spirit LM — テキストと音声統合のマルチモーダル言語モデル

•マルチモーダル•言語モデル

プロンプトエンジニアリング

プロンプトエンジニアリング — 包括的なプロンプトエンジニアリング技術リソース集

•プロンプトエンジニアリング•機械学習

Zamba2-7B — 高性能小型言語モデル

•言語モデル•自然言語処理

UniMuMo — 統一テキスト、音楽、動作生成モデル

•人工知能•機械学習

エントロピーベースサンプリング — エントロピーに基づくサンプリング技術により、モデル出力の多様性と精度を最適化します。

プログラミング

•機械学習•自然言語処理

AMD-Llama-135m — AMDがトレーニングした高性能言語モデル

プログラミング

•言語モデル•テキスト生成

Llama 3.2 — オープンソースのAIモデル。微調整、蒸留、展開が可能です。

世界的トレンド

•機械学習•オープンソース

pixtral-12b-240910 — 画像とテキストの理解をサポートする、マルチモーダル大規模言語モデルです。

•マルチモーダル•画像処理

ell — 軽量言語モデルプログラミングライブラリ。プロンプトを関数として扱います。

国際セレクション

•言語モデル•プログラミングライブラリ

rStar — 自己と対戦する相互推論によって、小型言語モデルの問題解決能力を向上させます。

プログラミング

•機械学習•自然言語処理

西湖大模型 — 高EQ・高IQを兼ね備えたマルチモーダル大規模言語モデル

中国セレクション

•人工知能•マルチモーダル

MiniCPM3-4B — 高性能な第3世代MiniCPMシリーズモデル

•言語モデル•テキスト生成

Phi-3.5-vision — 画像とテキストの理解をサポートする、高度なマルチモーダルモデルです。

プログラミング

•マルチモーダル•画像理解