AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

InternVL3

InternVL3オープンソース：テキスト、画像、ビデオ処理に対応する7種類のサイズ、マルチモーダル機能は工業用画像分析まで拡張

プレミアム新製品生産性マルチモーダル画像処理

ウェブサイトを開く

InternVL3は、OpenGVLabがオープンソースで公開したマルチモーダル大規模言語モデル（MLLM）であり、優れたマルチモーダル認識と推論能力を備えています。このモデルシリーズは1Bから78Bまでの7つのサイズがあり、テキスト、画像、ビデオなどの様々な情報を同時に処理でき、優れた全体的な性能を示します。InternVL3は、工業用画像分析、3Dビジョン認識などの分野で優れた性能を発揮し、そのテキスト性能はQwen2.5シリーズを上回っています。このモデルのオープンソース化は、マルチモーダルアプリケーション開発に強力なサポートを提供し、マルチモーダル技術のより多くの分野への応用を促進するのに役立ちます。

InternVL3

ウェブサイトを開く

InternVL3 最新のトラフィック状況

月間総訪問数

2788050

直帰率

37.33%

平均ページ/訪問

6.2

平均訪問時間

00:05:01

InternVL3 訪問数の傾向

InternVL3 訪問地理的分布

InternVL3 トラフィックソース

InternVL3 代替品

InternVL3 — InternVL3オープンソース：テキスト、画像、ビデオ処理に対応する7種類のサイズ、マルチモーダル機能は工業用画像分析まで拡張

•マルチモーダル•画像処理

搜狐シンプルAI — 多機能AIツールで、絵画、ライティング、画像処理サービスを提供します。

•デザインツール•画像処理

HiPixel — HiPixelは、AI駆動の画像超解像度処理のためのmacOSデスクトップクライアントアプリケーションです。

•画像処理•macOS

MistralOCR.net — Mistral OCR は、PDF や画像からテキスト、画像、表、数式を非常に高い精度で抽出できる強力なドキュメント理解 OCR 製品です。

•文書処理•OCR

AIウォーターマークリムーバー — 写真や動画の水印をすばやく削除できる無料のオンラインAIツールです。

•画像処理•水印削除

EgoLife — EgoLifeは、長期的なコンテキスト理解研究を推進することを目的とした、長期、マルチモーダル、多角的な日常生活AIアシスタントプロジェクトです。

•マルチモーダル•多角的

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

•人工知能•視覚生成

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Liteは、長文処理と多様なアプリケーションシナリオ向けに最適化された、高効率な言語モデルです。

•言語モデル•長文処理

Magma-8B — Magma-8Bは、マイクロソフトが開発したマルチモーダルAIモデルであり、画像とテキストの入力を処理してテキスト出力を生成します。

•マルチモーダル•画像

DeepSeek 日本語版 — DeepSeekは、論理推論、数学、プログラミングタスクに秀でた高度なAI言語モデルです。無料で利用できます。

•言語モデル•プログラミング支援

Grok 3 — xAI社が発表した最新鋭のフラッグシップAIモデル、Grok 3。強力な推論能力とマルチモーダル処理能力を備えています。

国際セレクション

•推論•マルチモーダル

AIヘッドショットジェネレーター — オンラインで無料で利用できるAIアバター生成ツール。普通の写真を高画質のプロフェッショナルなアバターに変換できます。

•アバター生成•オンラインツール

MedRAX — MedRAXは、胸部X線画像の解釈を支援する医療推論AIエージェントです。複数の分析ツールを統合し、追加のトレーニングなしで複雑な医療照会を処理できます。

•医療•胸部X線

VisoMaster — AI技術を活用した、自然な効果を実現する強力な動画置換・編集ソフトウェアです。

•動画編集•置換

Gemini 2.0 Pro — Gemini Proは、Google DeepMindが開発した高性能AIモデルであり、複雑なタスク処理とプログラミング性能に特化しています。

国際セレクション

•プログラミング•複雑なタスク

CUA — CUAは、グラフィカルインターフェースを通じてデジタル世界とインタラクトできる汎用インターフェースです。

世界的トレンド

•マルチモーダル•自動化

SmolVLM-256M-Instruct — SmolVLM-256Mは、世界最小級のマルチモーダルモデルであり、画像とテキストの入力を効率的に処理してテキスト出力を生成します。

•マルチモーダル•画像処理

Gemini 2.0 フラッシュ思考実験 — Gemini 2.0 フラッシュ思考実験は、推論プロセスを可視化することで性能と説明性を向上させた、推論能力を強化したモデルです。

•推論•マルチモーダル

InternVL2.5-38B-MPO — InternVL2.5-MPOシリーズモデルは、InternVL2.5と混合嗜好最適化に基づき、卓越した性能を発揮します。

•マルチモーダル•大規模言語モデル

InternVL2_5-26B-MPO-AWQ

InternVL2_5-26B-MPO-AWQ — 高度洗練されたマルチモーダル大規模言語モデルであり、卓越したマルチモーダル推論能力を備えています。

プログラミング

•マルチモーダル•大規模言語モデル

百度AIサーチ — 複数のAIサービスを統合したインテリジェント検索プラットフォーム

中国セレクション

•検索•コンテンツ作成

InternVL2_5-8B-MPO — 優れた総合性能を備えたマルチモーダル大規模言語モデルです。

•マルチモーダル•大規模言語モデル

EdgeOne Pages Functions AI OCR

EdgeOne Pages Functions AI OCR — AIによる画像文字認識サービス

•OCR•文字認識

InternVL2_5-4B-MPO — 卓越な総合性能を発揮するマルチモーダル大規模言語モデル

•マルチモーダル•大規模言語モデル

Valley — テキスト、画像、動画データを処理するマルチモーダル大規模言語モデル

•マルチモーダル•大規模言語モデル

InternVL2_5-2B-MPO

InternVL2_5-2B-MPO — 高度先進なマルチモーダル大規模言語モデル

•マルチモーダル•大規模言語モデル

Speed AI — AI技術を活用した写真編集アプリ。写真をアート画像や漫画風アバターに瞬時に変換します。

•写真編集•アート創作

Gemini 2.0 Flash — 次世代開発者向けAIツール。開発効率とアプリケーションのインタラクティブ性を向上させます。

国際セレクション

•開発•コードアシスト

Gemini 2.0 — Googleの新世代AIモデル。インテリジェントアシスタントの新時代を切り開きます。

世界的トレンド

•インテリジェントアシスタント•マルチモーダル

Poify — AIで無限の可能性を創造し、創造性を輝かせましょう。

国際セレクション

•創造性•画像処理