AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

DiffSensei

多モーダルLLMと拡散モデルを組み合わせた、カスタマイズ可能な漫画生成モデルです。

一般製品画像漫画生成多モーダル

ウェブサイトを開く

DiffSenseiは、多モーダル大規模言語モデル（LLM）と拡散モデルを組み合わせた、カスタマイズ可能な漫画生成モデルです。ユーザーが提供するテキストプロンプトとキャラクター画像に基づき、制御可能な白黒漫画パネルを生成し、柔軟なキャラクター適応性を備えています。この技術の重要性は、自然言語処理と画像生成を組み合わせることで、漫画制作とパーソナライズされたコンテンツ生成に新たな可能性を提供することにあります。DiffSenseiモデルは、高品質な画像生成、多様な応用シナリオ、そしてリソースの効率的な利用で注目されています。現在、GitHubで公開されており、無料でダウンロードして使用できますが、使用には一定の計算リソースが必要となる可能性があります。

DiffSensei

ウェブサイトを開く

DiffSensei 最新のトラフィック状況

月間総訪問数

521149929

直帰率

35.96%

平均ページ/訪問

6.1

平均訪問時間

00:06:29

DiffSensei 訪問数の傾向

DiffSensei 訪問地理的分布

DiffSensei トラフィックソース

DiffSensei 代替品

DiffSensei — 多モーダルLLMと拡散モデルを組み合わせた、カスタマイズ可能な漫画生成モデルです。

•漫画生成•多モーダル

CreatiLayout — 双子型多モーダル拡散トランスフォーマーに基づく、アイデアレイアウトから画像生成技術

•画像生成•多モーダル

Dream 7B — Dream 7Bは、最も強力なオープンソースの大規模言語モデルです。

•拡散モデル•大規模言語モデル

AccVideo — ビデオ拡散モデルの高速化を実現し、生成速度を8.5倍向上させました。

•動画生成•人工知能

InfiniteYou — 柔軟で高忠実度の画像生成を実現しながら、アイデンティティの特徴を維持します。

•画像生成•アイデンティティ保護

TrajectoryCrafter — 拡散モデルを使用して単眼ビデオのカメラ軌跡をリダイレクトします。

•ビデオ編集•カメラ軌跡

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

国際セレクション

•人工知能•言語モデル

Aya Vision — Aya Visionは、Cohereが提供する多言語・多モーダルなビジュアルモデルであり、多言語環境における視覚とテキストの理解能力の向上を目指しています。

国際セレクション

•多言語•多モーダル

Project Starlight — Project Starlight は、AI ベースのビデオ強化ツールで、低解像度および破損したビデオを高画質にアップスケールします。

•AI ビデオ強化•高画質修復

ViDoRAG — ViDoRAGは、視覚ドキュメント検索を強化した生成のための動的イテレーティブ推論エージェントフレームワークです。

プログラミング

•多モーダル•検索強化生成

Migician — Migicianは、複数の画像の配置に特化した多モーダル大規模言語モデルであり、自由形式の複数の画像の精密配置を実現できます。

•多モーダル•画像配置

Mercury Coder — Mercury Coder は、拡散モデルに基づく高性能コード生成言語モデルです。

国際セレクション

•コード生成•拡散モデル

VideoGrain — VideoGrainは、カテゴリレベル、インスタンスレベル、パーツレベルの動画編集を実現するためのゼロショット手法です。

•動画編集•拡散モデル

Magma — Magmaは、多様なモーダル入力の理解と実行が可能な基礎モデルであり、複雑なタスクや環境で使用できます。

•多モーダル•ロボット

MakeAnything — MakeAnythingは、多様な分野におけるプログラムによるシーケンス生成を行う拡散変換器モデルです。

•生成AI•多領域生成

Pippo — Pippoは、一枚の写真から高解像度で複数視点のビデオを生成する生成モデルです。

•画像生成•複数視点ビデオ

デバイス上Sora — デバイス上Soraは、拡散モデルに基づくモバイルデバイス向けテキストから動画生成プロジェクトです。

•動画生成•モバイルデバイス

DiffSplat — DiffSplatは、テキストプロンプトと単一視点画像から3Dガウシアン点群を生成するジェネレーティブフレームワークです。

•3D生成•ガウシアン点群

Go with the Flow — ビデオ拡散モデルのモーションモードを効率的に制御するための手法。モーションモードのカスタマイズと転移をサポートします。

•ビデオ生成•モーション制御

TokenVerse — TokenVerseは、事前学習済みテキストツーイメージ拡散モデルに基づく、多概念パーソナライズ手法です。

•画像生成•パーソナライズ

X-Dyna — X-Dynaは、拡散モデルに基づくゼロショットの人物画像アニメーション生成技術です。

•画像アニメーション•ゼロショット学習

HunYuan-3D 2.0 — HunYuan-3D 2.0は、テンセントが開発した、大規模拡散モデルに基づく高解像度3Dアセット生成システムです。

中国セレクション

•3D•テクスチャ生成

シェーダとしての拡散 (Diffusion as Shader)

シェーダとしての拡散 (Diffusion as Shader) — 様々なビデオ生成制御タスクに対応する統一アーキテクチャモデルです。

•ビデオ生成•3D認識

SeedVR

SeedVR — SeedVR：汎用動画修復のための拡散トランスフォーマーモデル

•動画修復•拡散モデル

VMix

VMix — テキストツーイメージ拡散モデルの美的品質向上ツール

•テキストツーイメージ•拡散モデル

DynamicControl

DynamicControl — 適応型条件選択により、テキストから画像への生成制御力を向上

•テキストから画像•拡散モデル

DiTCtrl — 多モーダル拡散トランスフォーマーにおける注意制御を探索し、微調整不要の複数プロンプトによる長尺動画生成を実現

•動画生成•多モーダル

Gemini多モーダルライブ＋WebRTC — Gemini多モーダルライブとWebRTC技術を統合したシングルファイルアプリケーションです。

プログラミング

•WebRTC•Gemini

InvSR — 拡散逆転に基づく多段階画像超解像度モデル

•画像超解像•拡散モデル

ColorFlow

ColorFlow — 細粒度な識別情報を保持する画像シーケンス彩色モデル

•画像彩色•識別情報保持