AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

llava-llama-3-8b-v1_1

XTunerで最適化されたLLaVAモデル。画像とテキストの処理能力を兼ね備えています。

プレミアム新製品プログラミング人工知能マルチモーダル学習

ウェブサイトを開く

llava-llama-3-8b-v1_1は、XTunerで最適化されたLLaVAモデルです。meta-llama/Meta-Llama-3-8B-InstructとCLIP-ViT-Large-patch14-336をベースに、ShareGPT4V-PTとInternVL-SFTでファインチューニングされています。画像とテキストの連携処理に特化しており、強力なマルチモーダル学習能力を備えています。様々な下流のデプロイメントや評価ツールキットに対応しています。

llava-llama-3-8b-v1_1

ウェブサイトを開く

llava-llama-3-8b-v1_1 最新のトラフィック状況

月間総訪問数

27175375

直帰率

44.30%

平均ページ/訪問

5.8

平均訪問時間

00:04:57

llava-llama-3-8b-v1_1 訪問数の傾向

llava-llama-3-8b-v1_1 訪問地理的分布

llava-llama-3-8b-v1_1 トラフィックソース

llava-llama-3-8b-v1_1 代替品

Bunny — 軽量ながらも強力な機能を備えたマルチモーダルモデルファミリーです。

プログラミング

•マルチモーダル学習•機械学習

llava-llama-3-8b-v1_1 — XTunerで最適化されたLLaVAモデル。画像とテキストの処理能力を兼ね備えています。

プログラミング

•人工知能•マルチモーダル学習

Liquid — 視覚理解と生成を統合したマルチモーダル生成モデルです。

•マルチモーダル•生成モデル

GLM-4-32B — 様々な自然言語処理タスクに対応した強力な言語モデルです。

中国セレクション

•自然言語処理•深層学習

Video-T1 — テスト時間スケーリングにより、動画生成の品質が大幅に向上します。

•動画生成•テスト時間スケーリング

混元T1 — 業界をリードする深層推論大規模モデルで、人間の好みを最適化しています。

中国セレクション

•深層学習•推論モデル

IMM — Inductive Moment Matchingは、高品質な画像生成に使用される新しいタイプの生成モデルです。

•生成モデル•画像生成

HunyuanVideo-I2V — HunyuanVideo-I2Vは、テンセントがHunyuanVideoに基づいて開発した、画像から動画を生成するフレームワークです。

•動画生成•人工知能

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

•人工知能•視覚生成

QwQ-Max-Preview — QwQ-Max-Previewは、Qwenシリーズの最新成果であり、Qwen2.5-Maxを基盤として構築されています。強力な推論能力と多様な分野への適用能力を備えています。

中国セレクション

•人工知能•深層学習

Claude 3.7 Sonnet — Anthropic社が開発した最新のAIモデルで、高速な応答と高度な推論を両立します。

世界的トレンド

•人工知能•深層学習

Huginn-0125 — Huginn-0125は、35億パラメータを持つ潜在変数循環型深層モデルであり、推論とコード生成に優れています。

プログラミング

•人工知能•深層学習

Lumina-Video — Lumina-Videoは、テキストからビデオを生成する試作プロジェクトです。

•ビデオ生成•人工知能

VideoJAM — VideoJAMは、動画生成モデルのモーションの一貫性を向上させるためのフレームワークです。

•動画生成•モーションの一貫性

MatAnyone — MatAnyoneは、複雑な背景にも対応可能な、目標指定をサポートする安定したビデオマット化フレームワークです。

•ビデオマット化•人工知能

Janus-Pro-7B — Janus-Pro-7Bは、マルチモーダルな理解と生成を統合した、新しい自己回帰フレームワークです。

•マルチモーダル•画像生成

Tarsier — Tarsierは、バイトダンスが開発した、高品質なビデオ説明を生成するための、大規模なビデオ言語モデルです。

•動画説明•動画理解

leapfusion-hunyuan-image2video — Hunyuanモデルに基づいた、高品質な動画生成を実現する革新的な画像から動画への変換技術です。

•人工知能•動画生成

OmniThink

OmniThink — OmniThinkは、人間の思考プロセスを模倣することで、機械による文章作成における知識密度を向上させるフレームワークです。

•機械ライティング•知識密度

Seaweed-APT — Seaweed-APTは、リアルタイムで1280x720、24fpsの動画をシングルステップで生成できるモデルです。

•動画生成•人工知能

MangaNinja — MangaNinjaは、参照画像を基にした線画彩色手法で、精緻なマッチングと細やかなインタラクティブ制御を実現します。

•画像処理•線画彩色

MiniMax-01 — 4,560億パラメーターを持つ強力な言語モデルで、最大400万トークンのコンテキストを処理可能です。

プログラミング

•人工知能•言語モデル

rStar-Math

rStar-Math — 小型言語モデルが自己進化と深層思考を通じて数学的推論能力を習得する研究成果を示します。

•人工知能•言語モデル

SVFR — SVFRは、動画顔修復のための統一フレームワークです。

•動画顔修復•画像処理

Infini-Megrez — 端側全モーダル理解モデル。ソフトウェアとハードウェアの協調により、無穹端側インテリジェンスを実現

•人工知能•深層学習

CausVid

CausVid — 高速因果ビデオジェネレーター。リアルタイムでのビデオ生成を実現します。

•ビデオ生成•人工知能

MMAudio — MMAudioは、ビデオおよび/またはテキスト入力から同期音声ファイルを生成します。

•音声合成•ビデオ処理

Florence-VL — 視覚言語モデル強化ツール。生成型視覚エンコーダと深層幅融合技術を組み合わせました。

プログラミング

•視覚言語モデル•マルチモーダル学習

Genie 2

Genie 2 — 大規模基礎世界モデルで、多様な3D操作可能な環境を生成します。

•人工知能•深層学習

LLaVA-o1 — 段階的推論が可能な視覚言語モデル

•視覚言語モデル•段階的推論