AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

InternVL

オープンソースのビジョン基礎モデル

一般製品画像オープンソース基礎モデル

ウェブサイトを開く

InternVLは、ViTモデルを60億パラメーターに拡張し、言語モデルとアライメントさせることで、現在最大の140億パラメーターのオープンソースビジョン基礎モデルを構築しました。これにより、視覚認識、クロスモーダル検索、マルチモーダル対話など幅広いタスクにおいて、32項目もの最先端性能を達成しています。

ウェブサイトを開く

InternVL 最新のトラフィック状況

月間総訪問数

521149929

直帰率

35.96%

平均ページ/訪問

6.1

平均訪問時間

00:06:29

InternVL 訪問数の傾向

InternVL 訪問地理的分布

InternVL トラフィックソース

InternVL 代替品

InternVL — オープンソースのビジョン基礎モデル

画像

•オープンソース•基礎モデル

2460

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

InternVL

InternVL 最新のトラフィック状況

InternVL 訪問数の傾向

InternVL 訪問地理的分布

InternVL トラフィックソース

InternVL 代替品

InternVL — オープンソースのビジョン基礎モデル

Step1X-Edit — 様々なユーザー指示に対応する、統一的な画像編集モデルです。

Wiredoor — 自己ホスト型の Ingress as a Service プラットフォームで、プライベートネットワークアプリケーションを安全に公開します。

Kimi-Audio — Kimi-Audioは、オーディオの理解と生成に長けたオープンソースのオーディオ基礎モデルです。

Flex.2-preview — オープンソースの80億パラメーターのテキストから画像への拡散モデルです。

Dia AI — 一度のパスで超リアルな会話を生成できるTTSモデル。

suna — あらゆるタスクを支援するオープンソースの万能AIアシスタント。

Search-R1 — 推論と検索エンジンの呼び出しを行う言語モデルをトレーニングするための、効率的な強化学習フレームワークです。

LeoMoon Wiki-Go — データベース不要の現代的で機能豊富な平面ファイルWikiプラットフォーム。

ChatTS-14B — 合成データによって時系列の理解と推論を強化するモデル。

AI Playground — Intel Arc GPUベースのAI画像生成とチャットボットアプリケーション。

Wan2.1-FLF2V-14B — 様々な生成タスクに対応したオープンソースのビデオ生成モデルです。

EaseVoice Trainer — シンプルで使いやすい音声クローンと音声モデルトレーニングツールです。

PureChat — Vue3 + ElementPlus をベースとした、複数のLLM（大規模言語モデル）を内蔵したチャットアプリケーションです。

AI動画テキスト作成アシスタント — 動画と音声をワンクリックで様々なスタイルの文書に変換します。

automcp — 既存のエージェントフレームワーク内のツール、エージェント、スケジューラをMCPサーバーに簡単に変換します。

Awesome GPT-4o 画像 — OpenAI GPT-4oが生成した多様なAIアート画像とプロンプトを厳選して展示しています。

Skywork-OR1 — 昆侖万维がオープンソース化した、高性能な数学コード推論モデル。卓越した性能を誇ります。

Droidrun — AI が Android デバイスを制御できる強力な自動化ツール。

mcp-use — mcp-use は MCP ツールと対話するための最も簡単な方法であり、カスタムエージェントをサポートします。

Pusa — Pusaは、様々な動画生成タスクに対応した、革新的な動画拡散モデルです。

UNO — 生成モデルを用いて画像生成の一貫性を向上させるツールです。

BabelDOC — PDF科学論文の翻訳とバイリンガル比較を行うためのライブラリです。

AGI News — 自律型AIエージェントが提供する毎日のAIニュースレターです。

pdf-document-layout-analysis — 強力なPDF文書レイアウト分析サービスです。

DeepCoder — 効率的なコード推論能力を備えた、オープンソースの140億パラメーターのプログラミングモデルです。

SkyReels-A2 — 動画拡散トランスフォーマーで任意のコンテンツを合成するためのフレームワーク。

Agno — 多様なモダリティを持つエージェントを構築するための軽量ライブラリです。

DeepSeek-V3-0324 — 様々な対話アプリケーションに適した、強力なテキスト生成モデルです。

Fin-R1 — 強化学習によって駆動される金融推論の大規模言語モデル。