AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

Valley

テキスト、画像、動画データを処理するマルチモーダル大規模言語モデル

一般製品画像マルチモーダル大規模言語モデル

ウェブサイトを開く

Valleyは、バイトダンスが開発した最先端のマルチモーダル大規模言語モデルであり、テキスト、画像、動画データを含む様々なタスクを処理できます。内部のECサイトと短編動画のベンチマークテストで最良の結果を達成し、他のオープンソースモデルを上回っています。OpenCompassテストでは、同規模のモデルと比較して平均スコアが67.40以上であり、10B未満のモデルの中では2位にランクインしています。Valley-EagleバージョンはEagleを参考に、トークンの数を柔軟に調整し、元のビジュアルトークンと並列で動作するビジュアルエンコーダを導入することで、極端な状況でのモデル性能を向上させています。

ウェブサイトを開く

Valley 最新のトラフィック状況

月間総訪問数

521149929

直帰率

35.96%

平均ページ/訪問

6.1

平均訪問時間

00:06:29

Valley 訪問数の傾向

Valley 訪問地理的分布

Valley トラフィックソース

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

Valley

Valley 最新のトラフィック状況

Valley 訪問数の傾向

Valley 訪問地理的分布

Valley トラフィックソース

Valley 代替品

InternVL2.5-38B-MPO — InternVL2.5-MPOシリーズモデルは、InternVL2.5と混合嗜好最適化に基づき、卓越した性能を発揮します。

InternVL2_5-26B-MPO-AWQ — 高度洗練されたマルチモーダル大規模言語モデルであり、卓越したマルチモーダル推論能力を備えています。

InternVL2_5-8B-MPO — 優れた総合性能を備えたマルチモーダル大規模言語モデルです。

InternVL2_5-4B-MPO — 卓越な総合性能を発揮するマルチモーダル大規模言語モデル

Valley — テキスト、画像、動画データを処理するマルチモーダル大規模言語モデル

InternVL2_5-2B-MPO — 高度先進なマルチモーダル大規模言語モデル

Llama-3.2-11B-Vision — 画像とテキストの処理に対応した、マルチモーダル大規模言語モデルです。

InternVL3 — InternVL3オープンソース：テキスト、画像、ビデオ処理に対応する7種類のサイズ、マルチモーダル機能は工業用画像分析まで拡張

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

M2RAG — マルチモーダルコンテキストにおける検索強化生成のためのベンチマークテストコードリポジトリです。

MNN大規模言語モデル Androidアプリ — 多様なモダリティに対応した、フル機能の巨大言語モデルAndroidアプリです。

SmolVLM-256M-Instruct — SmolVLM-256Mは、世界最小級のマルチモーダルモデルであり、画像とテキストの入力を効率的に処理してテキスト出力を生成します。

Doubao-1.5-pro — Doubao-1.5-proは、推論性能とモデル能力の究極的なバランスに重点を置いた、高性能なスパースMoE（Mixture of Experts）大規模言語モデルです。

InternVL2_5-78B-MPO — これは、優れた総合性能を示す高度なマルチモーダル大規模言語モデルシリーズです。

MinMo — MinMoは、シームレスな音声インタラクションを可能にするマルチモーダル大規模言語モデルです。

VITA-1.5 — VITA-1.5：リアルタイムの視覚と音声インタラクションを備えたGPT-4o級のマルチモーダル大規模言語モデル

Valley 2.0 — テキスト、画像、動画データを処理する能力を向上させた、マルチモーダル大規模言語モデルです。

Valley-Eagle-7B — テキスト、画像、ビデオデータを処理するマルチモーダル大規模言語モデル

FlagAI — 一站式の大規模言語モデルアルゴリズム、モデル、最適化ツールを提供するオープンソースプロジェクト

InternVL2_5-1B-MPO — 視覚と言語の包括的な理解能力を向上させる、マルチモーダル大規模言語モデル

InternVL 2.5 — オープンソースのマルチモーダル大規模言語モデルシリーズ

InternVL2_5-4B — 視覚と言語理解を融合したマルチモーダル大規模言語モデル。

InternVL2_5-2B — 画像とテキストの深層的な相互作用をサポートする、マルチモーダル大規模言語モデルです。

InternVL2_5-1B — 画像とテキストの理解をサポートするマルチモーダル大規模言語モデル

InternVL2_5-8B — 画像とテキストの相互理解をサポートする、マルチモーダル大規模言語モデルです。

InternVL2_5-26B — 視覚と言語理解を融合したマルチモーダル大規模言語モデル。

Pixtral-Large-Instruct-2411 — 1240億パラメータのマルチモーダル大規模言語モデル

ultravox-v0_4_1-llama-3_1-70b — 多様な音声に対応する大規模言語モデル

Ferret-UI-Llama8b — Llama-3-8Bを基盤とした、UIタスクに特化したマルチモーダル大規模言語モデルです。

岩芯数智 — 国産の大規模言語モデル。マルチモーダルに対応し、迅速かつ低コストでインテリジェント化への転換を支援します。