AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

Show-o

統一多モーダル理解と生成を行う単一トランスフォーマー

一般製品画像人工知能多モーダル

ウェブサイトを開く

Show-oは、画像キャプション、Visual Question Answering（VQA）、テキストから画像への生成、テキストによる修復と拡張、および混合モーダル生成を処理できる、多モーダル理解と生成のための単一トランスフォーマーモデルです。シンガポール国立大学Show Labとバイトダンス（ByteDance）が共同で開発され、最新の深層学習技術を採用しており、多様なモーダルデータの理解と生成が可能で、人工知能分野における大きな進歩です。

Show-o

ウェブサイトを開く

Show-o 最新のトラフィック状況

月間総訪問数

521149929

直帰率

35.96%

平均ページ/訪問

6.1

平均訪問時間

00:06:29

Show-o 訪問数の傾向

Show-o 訪問地理的分布

Show-o トラフィックソース

Show-o 代替品

Show-o — 統一多モーダル理解と生成を行う単一トランスフォーマー

•人工知能•多モーダル

Liquid — 視覚理解と生成を統合したマルチモーダル生成モデルです。

•マルチモーダル•生成モデル

GLM-4-32B — 様々な自然言語処理タスクに対応した強力な言語モデルです。

中国セレクション

•自然言語処理•深層学習

Video-T1 — テスト時間スケーリングにより、動画生成の品質が大幅に向上します。

•動画生成•テスト時間スケーリング

混元T1 — 業界をリードする深層推論大規模モデルで、人間の好みを最適化しています。

中国セレクション

•深層学習•推論モデル

IMM — Inductive Moment Matchingは、高品質な画像生成に使用される新しいタイプの生成モデルです。

•生成モデル•画像生成

HunyuanVideo-I2V — HunyuanVideo-I2Vは、テンセントがHunyuanVideoに基づいて開発した、画像から動画を生成するフレームワークです。

•動画生成•人工知能

UniTok — UniTokは、視覚生成と理解のための統一的な視覚トークナイザーです。

•人工知能•視覚生成

Migician — Migicianは、複数の画像の配置に特化した多モーダル大規模言語モデルであり、自由形式の複数の画像の精密配置を実現できます。

•多モーダル•画像配置

QwQ-Max-Preview — QwQ-Max-Previewは、Qwenシリーズの最新成果であり、Qwen2.5-Maxを基盤として構築されています。強力な推論能力と多様な分野への適用能力を備えています。

中国セレクション

•人工知能•深層学習

Claude 3.7 Sonnet — Anthropic社が開発した最新のAIモデルで、高速な応答と高度な推論を両立します。

世界的トレンド

•人工知能•深層学習

Huginn-0125 — Huginn-0125は、35億パラメータを持つ潜在変数循環型深層モデルであり、推論とコード生成に優れています。

プログラミング

•人工知能•深層学習

Lumina-Video — Lumina-Videoは、テキストからビデオを生成する試作プロジェクトです。

•ビデオ生成•人工知能

VideoJAM — VideoJAMは、動画生成モデルのモーションの一貫性を向上させるためのフレームワークです。

•動画生成•モーションの一貫性

MatAnyone — MatAnyoneは、複雑な背景にも対応可能な、目標指定をサポートする安定したビデオマット化フレームワークです。

•ビデオマット化•人工知能

Janus-Pro-7B — Janus-Pro-7Bは、マルチモーダルな理解と生成を統合した、新しい自己回帰フレームワークです。

•マルチモーダル•画像生成

Tarsier — Tarsierは、バイトダンスが開発した、高品質なビデオ説明を生成するための、大規模なビデオ言語モデルです。

•動画説明•動画理解

leapfusion-hunyuan-image2video — Hunyuanモデルに基づいた、高品質な動画生成を実現する革新的な画像から動画への変換技術です。

•人工知能•動画生成

OmniThink

OmniThink — OmniThinkは、人間の思考プロセスを模倣することで、機械による文章作成における知識密度を向上させるフレームワークです。

•機械ライティング•知識密度

Seaweed-APT — Seaweed-APTは、リアルタイムで1280x720、24fpsの動画をシングルステップで生成できるモデルです。

•動画生成•人工知能

MangaNinja — MangaNinjaは、参照画像を基にした線画彩色手法で、精緻なマッチングと細やかなインタラクティブ制御を実現します。

•画像処理•線画彩色

MiniMax-01 — 4,560億パラメーターを持つ強力な言語モデルで、最大400万トークンのコンテキストを処理可能です。

プログラミング

•人工知能•言語モデル

rStar-Math

rStar-Math — 小型言語モデルが自己進化と深層思考を通じて数学的推論能力を習得する研究成果を示します。

•人工知能•言語モデル

SVFR — SVFRは、動画顔修復のための統一フレームワークです。

•動画顔修復•画像処理

DiffSensei — 多モーダルLLMと拡散モデルを組み合わせた、カスタマイズ可能な漫画生成モデルです。

•漫画生成•多モーダル

Infini-Megrez — 端側全モーダル理解モデル。ソフトウェアとハードウェアの協調により、無穹端側インテリジェンスを実現

•人工知能•深層学習

CausVid

CausVid — 高速因果ビデオジェネレーター。リアルタイムでのビデオ生成を実現します。

•ビデオ生成•人工知能

Genie 2

Genie 2 — 大規模基礎世界モデルで、多様な3D操作可能な環境を生成します。

•人工知能•深層学習

LLaMA-Mesh

LLaMA-Mesh — 3Dメッシュ生成と大規模言語モデルの統合

•3Dモデリング•人工知能

NVIDIAビデオ検索と要約

NVIDIAビデオ検索と要約 — ビデオの洞察を抽出するビデオ検索と要約エージェントを構築します

•ビデオ分析•人工知能