AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

MoE-LLaVA

大規模視覚言語モデルに基づくエキスパート混合モデル

一般製品画像大規模モデルマルチモーダル学習

ウェブサイトを開く

MoE-LLaVAは、大規模視覚言語モデルに基づくエキスパート混合モデルであり、マルチモーダル学習において優れた性能を発揮します。パラメータ数は少ないにもかかわらず、高い性能を示し、短時間でトレーニングを完了できます。Gradio Web UIとCLI推論に対応しており、モデルライブラリ、要件とインストール、トレーニングと検証、カスタマイズ、可視化、APIなどの機能を提供します。

MoE-LLaVA

ウェブサイトを開く

MoE-LLaVA 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

MoE-LLaVA 訪問数の傾向

MoE-LLaVA 訪問地理的分布

MoE-LLaVA トラフィックソース

MoE-LLaVA 代替品

MoE-LLaVA — 大規模視覚言語モデルに基づくエキスパート混合モデル

•大規模モデル•マルチモーダル学習

MG-LLaVA — 多粒度視覚指示微調整による革新的なMLLM

プログラミング

•機械学習•画像処理

Thera — エイリアシングのない任意の尺度での超解像度手法です。

•超解像度•画像処理

AIウォーターマークリムーバー — 写真や動画の水印をすばやく削除できる無料のオンラインAIツールです。

•画像処理•水印削除

Picture AI — 様々な画像処理機能を提供する、強力なオンラインAI画像生成と編集ツールです。

•AI画像生成•オンライン編集

MIDI — 多インスタンス拡散モデルを使用して、単一画像から高忠実度の3Dシーンを生成します。

•3Dモデリング•画像処理

HunyuanVideo-I2V — HunyuanVideo-I2Vは、テンセントがHunyuanVideoに基づいて開発した、画像から動画を生成するフレームワークです。

•動画生成•人工知能

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

•人工知能•視覚生成

VisionAgent — VisionAgentは、ビジョンタスクを解決するためのコードを生成するライブラリです。複数のLLMプロバイダーに対応しています。

•人工知能•ビジョンタスク

Light-A-Video — Light-A-Videoは、トレーニング不要のビデオ再照明技術です。漸進的な照明融合により、滑らかなビデオ再照明効果を実現します。

•ビデオ再照明•AI技術

AIヘッドショットジェネレーター — オンラインで無料で利用できるAIアバター生成ツール。普通の写真を高画質のプロフェッショナルなアバターに変換できます。

•アバター生成•オンラインツール

Animate Anyone 2 — Animate Anyone 2は、高忠実度なキャラクター画像アニメーション生成ツールで、環境への適応をサポートします。

•アニメーション生成•環境適応

VisoMaster — AI技術を活用した、自然な効果を実現する強力な動画置換・編集ソフトウェアです。

•動画編集•置換

Genime AI — Genime AIは、アニメーションの生成と編集に特化したツールで、画像から3Dへの変換や、補間アニメーションなどの機能を提供します。

•AIアニメーション•画像処理

MatAnyone — MatAnyoneは、複雑な背景にも対応可能な、目標指定をサポートする安定したビデオマット化フレームワークです。

•ビデオマット化•人工知能

Tülu 3 405B — Tülu 3 405Bは、強化学習によって性能を向上させた大規模なオープンソース言語モデルです。

プログラミング

•人工知能•自然言語処理

leapfusion-hunyuan-image2video — Hunyuanモデルに基づいた、高品質な動画生成を実現する革新的な画像から動画への変換技術です。

•人工知能•動画生成

SmolVLM-256M-Instruct — SmolVLM-256Mは、世界最小級のマルチモーダルモデルであり、画像とテキストの入力を効率的に処理してテキスト出力を生成します。

•マルチモーダル•画像処理

GLM-PC — GLM-PCは、CogAgentビジョン言語大規模モデルを基盤としたコンピューターインテリジェンスで、パソコン操作体験の向上を目指しています。

•インテリジェンス•大規模モデル

美間AI無損拡大 — 美間AI無損拡大で、ワンクリックで画像の鮮明度を向上させ、高画質で拡大できます。

•AI技術•画像処理

MangaNinja — MangaNinjaは、参照画像を基にした線画彩色手法で、精緻なマッチングと細やかなインタラクティブ制御を実現します。

•画像処理•線画彩色

googleocr-app — Google Gemini 2.0 をベースとした高精度OCR文字認識アプリです。

•文字認識•画像処理

Shapen — 画像を3Dモデルに変換し、レンダリング、アニメーション、3Dプリントに使用できます。

•3Dモデリング•画像処理

美图雲修 — プロレベルAIによる人物画像の精密修整。高速処理で、最高の効果を実現します。

•AI修整•人物画像修整

StructLDM — 2D画像から3D人体生成を学習する構造化潜在拡散モデルです。

•3D人体生成•潜在拡散モデル

FitDiT — FitDiTは、高精度なバーチャル試着を実現する革新的な衣服感知強化技術です。

•バーチャル試着•画像処理

Hallo3 — 拡散変換器ネットワークに基づく、高動的でリアルな肖像画像アニメーション技術です。

•肖像アニメーション•動画生成

SVFR — SVFRは、動画顔修復のための統一フレームワークです。

•動画顔修復•画像処理

InternVL2.5-38B-MPO — InternVL2.5-MPOシリーズモデルは、InternVL2.5と混合嗜好最適化に基づき、卓越した性能を発揮します。

•マルチモーダル•大規模言語モデル