InternVL2_5-4B-MPO-AWQ

画像とテキストの相互作用能力を最適化した多様なモダリティを持つ大規模言語モデル

一般製品画像多様なモダリティ大規模言語モデル

InternVL2_5-4B-MPO-AWQは、画像とテキストの相互作用タスクにおけるモデルのパフォーマンス向上に焦点を当てた、多様なモダリティを持つ大規模言語モデル（MLLM）です。InternVL2.5シリーズをベースとし、混合嗜好最適化（MPO）によって性能がさらに向上しています。単一画像や複数画像、動画データなど、多様な入力に対応可能であり、画像とテキストの相互理解が必要な複雑なタスクに適しています。InternVL2_5-4B-MPO-AWQはその優れた多様なモダリティ能力により、画像とテキストからテキストを生成するタスクに強力なソリューションを提供します。

Best AI Websites & Tools

InternVL2_5-4B-MPO-AWQ

InternVL2_5-4B-MPO-AWQ 最新のトラフィック状況

InternVL2_5-4B-MPO-AWQ 訪問数の傾向

InternVL2_5-4B-MPO-AWQ 訪問地理的分布

InternVL2_5-4B-MPO-AWQ トラフィックソース

InternVL2_5-4B-MPO-AWQ 代替品

InternVL2_5-4B-MPO-AWQ — 画像とテキストの相互作用能力を最適化した多様なモダリティを持つ大規模言語モデル

Sonus-1 — Sonus-1：次世代大規模言語モデル（LLM）の幕開け

Valley 2.0 — テキスト、画像、動画データを処理する能力を向上させた、マルチモーダル大規模言語モデルです。

InternVL 2.5 — オープンソースのマルチモーダル大規模言語モデルシリーズ

O1-Journey — O1複製の旅：戦略進捗報告第一部

LongVU — 長尺動画言語理解のための時空間適応圧縮モデル

Llama-3.2-3B — 多言語大規模言語モデル

RWKV v6 Finch 14B — RWKV v6 Finch 14Bは、長文処理に優れたオープンソースの大規模言語モデルです。

NotaGen — NotaGen は、大規模言語モデルのトレーニングパラダイムを採用し、高品質のクラシック音楽楽譜の生成に特化した、記号音楽生成モデルです。

The Ultra-Scale Playbook — 超大規模システムの設計と最適化に特化したツールで、効率的なソリューションを提供します。

DMXAPI — DMXAPIは、300種類以上の大規模言語モデル（LLM）APIを統合するグローバルなプラットフォームです。

人類最後の試験 (Humanity's Last Exam) — 人類最後の試験 (Humanity's Last Exam) は、大規模言語モデルの能力を測るための多様なモダリティを含むベンチマークテストです。

Baichuan-M1-14B — 百川智能が開発した、医療現場向けに最適化されたオープンソースの大規模言語モデルです。優れた汎用性と医療分野での高い性能を備えています。

PaSa — PaSaは、大規模言語モデルを駆使した高度な学術論文検索エージェントであり、自律的に意思決定を行い、正確な結果を取得します。

自己適応型LLM — 未経験のタスクにもリアルタイムで適応する、自己適応型大規模言語モデルフレームワークです。

MinMo — MinMoは、シームレスな音声インタラクションを可能にするマルチモーダル大規模言語モデルです。

Agent Laboratory — Agent Laboratoryは、人間の研究者を支援し、研究アイデアの実現を促進するための、エンドツーエンドの自律型研究ワークフローです。

InternVL2_5-26B-MPO — 視覚と言語のインタラクション能力を向上させた、多様なモダリティに対応する大規模言語モデルです。

InternVL2_5-8B-MPO-AWQ — 視覚と言語の相互作用能力を向上させた多様なモダリティに対応する大規模言語モデル

InternVL2_5-8B-MPO — 優れた総合性能を備えたマルチモーダル大規模言語モデルです。

shoonya — 商業分野向け基礎モデルと代理

Valley — テキスト、画像、動画データを処理するマルチモーダル大規模言語モデル

FlagAI — 一站式の大規模言語モデルアルゴリズム、モデル、最適化ツールを提供するオープンソースプロジェクト

InternVL2-8B-MPO — 多様なモダリティに対応する大規模言語モデルで、多様なモダリティ推論能力を向上させます。

FlagEval — モデル評価プラットフォーム

如意-Mini-7B — オープンソースの画像から動画への生成モデル

Astris AI — Astris AIは、ロッキード・マーティン社が提供する、セキュリティに特化した人工知能ソリューションです。

Recursal AI — 人工知能を誰もが利用できるようにする

Apollo-LMMs — 大規模マルチモーダルモデルにおける動画理解の探求

CosyVoice音声生成大規模モデル2.0-0.5B — 効率的で多言語対応の音声合成モデル