AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

Lumina-T2X

あらゆるモダリティへのテキスト生成を統合したフレームワーク

一般製品画像テキストから画像テキストから動画

ウェブサイトを開く

Lumina-T2Xは、テキスト記述から鮮明な画像、ダイナミックな動画、詳細な多視点3D画像、合成音声などを生成できる、先進的なテキストから任意のモダリティへの生成フレームワークです。ストリーミングベースの大規模拡散トランスフォーマー（Flag-DiT）を採用し、最大7億パラメータに対応、シーケンス長は最大128,000トークンに拡張可能です。Lumina-T2Xは、画像、動画、3Dオブジェクトの多視点ビュー、音声スペクトログラムを時空間潜在トークン空間に統合することで、任意の解像度、アスペクト比、長さの出力生成を可能にします。

Lumina-T2X

ウェブサイトを開く

Lumina-T2X 最新のトラフィック状況

月間総訪問数

521149929

直帰率

35.96%

平均ページ/訪問

6.1

平均訪問時間

00:06:29

Lumina-T2X 訪問数の傾向

Lumina-T2X 訪問地理的分布

Lumina-T2X トラフィックソース

Lumina-T2X 代替品

AsyncDiff — 非同期ノイズ除去による並列化拡散モデル

プログラミング

•分散計算•テキストから画像

Lumina-T2X — あらゆるモダリティへのテキスト生成を統合したフレームワーク

•テキストから画像•テキストから動画

DynamicControl

DynamicControl — 適応型条件選択により、テキストから画像への生成制御力を向上

•テキストから画像•拡散モデル

text-to-pose — テキストからポーズを生成し、さらに画像を生成するモデルです。

•テキストから画像•ポーズ推定

SeedEdit — テキストプロンプトに基づいて画像を修正する大規模拡散モデル

•画像編集•拡散モデル

Stable Diffusion 3.5 Large Turbo

Stable Diffusion 3.5 Large Turbo — 高性能なテキストから画像生成モデル

•テキストから画像•生成モデル

Stable Diffusion 3.5 Large

Stable Diffusion 3.5 Large — 高性能のテキストから画像を生成するモデル

•画像生成•テキストから画像

Concept Sliders — 拡散モデルにおける概念を精密に制御するための低ランクアダプター

•画像生成•テキストから画像

Slicedit — テキストベースのビデオ編集技術。時空間スライシングを使用します。

•ビデオ編集•テキストから画像

ELLA — LLMによる意味整合性を強化した拡散モデルアダプター

•テキストから画像•意味整合

SLD（自己修正型LLM制御拡散モデル） — 公式実装の自己修正型LLM制御拡散モデル

•画像生成•AIアート

FreeControl — テキストから画像生成プロセスを制御します

•テキストから画像•画像生成

Show-1 — Show-1は、効率的な高品質なテキストから動画への生成を実現するため、ピクセルベースと潜在拡散モデルを組み合わせたモデルです。

•テキストから動画•動画生成

Dream 7B — Dream 7Bは、最も強力なオープンソースの大規模言語モデルです。

•拡散モデル•大規模言語モデル

AccVideo — ビデオ拡散モデルの高速化を実現し、生成速度を8.5倍向上させました。

•動画生成•人工知能

InfiniteYou — 柔軟で高忠実度の画像生成を実現しながら、アイデンティティの特徴を維持します。

•画像生成•アイデンティティ保護

Wan 2.1 AI — Wan 2.1 AIは、テキストと画像を高品質な動画に変換する高度なAI動画生成モデルです。

•AI動画生成•テキストから動画

TrajectoryCrafter — 拡散モデルを使用して単眼ビデオのカメラ軌跡をリダイレクトします。

•ビデオ編集•カメラ軌跡

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

国際セレクション

•人工知能•言語モデル

CogView4-6B — CogView4-6Bは、高品質な画像生成に特化した強力なテキストから画像への生成モデルです。

•テキストから画像•深層学習

Project Starlight — Project Starlight は、AI ベースのビデオ強化ツールで、低解像度および破損したビデオを高画質にアップスケールします。

•AI ビデオ強化•高画質修復

Wan2GP — Wan2GPは、低スペックGPUユーザー向けに設計された、最適化されたオープンソースの動画生成モデルです。様々な動画生成タスクに対応しています。

•動画生成•低スペックGPU

Mercury Coder — Mercury Coder は、拡散モデルに基づく高性能コード生成言語モデルです。

国際セレクション

•コード生成•拡散モデル

VideoGrain — VideoGrainは、カテゴリレベル、インスタンスレベル、パーツレベルの動画編集を実現するためのゼロショット手法です。

•動画編集•拡散モデル

Wan2.1-T2V-14B — Wan2.1-T2V-14Bは、様々な動画生成タスクに対応する高性能なテキストから動画への生成モデルです。

•動画生成•テキストから動画

MakeAnything — MakeAnythingは、多様な分野におけるプログラムによるシーケンス生成を行う拡散変換器モデルです。

•生成AI•多領域生成

FlashVideo — FlashVideoは、ディテールと忠実度の高い高解像度動画生成モデルです。

•動画生成•効率的な計算

Pippo — Pippoは、一枚の写真から高解像度で複数視点のビデオを生成する生成モデルです。

•画像生成•複数視点ビデオ

デバイス上Sora — デバイス上Soraは、拡散モデルに基づくモバイルデバイス向けテキストから動画生成プロジェクトです。

•動画生成•モバイルデバイス

DiffSplat — DiffSplatは、テキストプロンプトと単一視点画像から3Dガウシアン点群を生成するジェネレーティブフレームワークです。

•3D生成•ガウシアン点群