AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

FLOAT

流マッチングに基づくオーディオ駆動型話者像ビデオ生成手法

一般製品画像人工知能人物アニメーション

ウェブサイトを開く

FLOATは、流マッチング生成モデルに基づくオーディオ駆動型の人物ビデオ生成手法です。生成モデリングをピクセルベースの潜在空間から学習済みモーション潜在空間に移行することで、時間的に一貫性のあるモーションデザインを実現しています。本手法は、トランスフォーマーベースのベクトル場予測器を導入し、シンプルかつ効果的なフレーム単位の条件付けメカニズムを備えています。さらに、FLOATは音声駆動型感情増強に対応しており、表現力豊かなモーションを自然に統合できます。広範な実験により、FLOATは視覚品質、モーション忠実度、効率性において、既存のオーディオ駆動型話者像手法を上回ることが示されています。

FLOAT

ウェブサイトを開く

FLOAT 最新のトラフィック状況

月間総訪問数

1719

直帰率

55.71%

平均ページ/訪問

1.0

平均訪問時間

00:00:00

FLOAT 訪問数の傾向

FLOAT 訪問地理的分布

FLOAT トラフィックソース

FLOAT 代替品

FLOAT — 流マッチングに基づくオーディオ駆動型話者像ビデオ生成手法

•人工知能•人物アニメーション

JoyVASA — 拡散モデルに基づく音声駆動型の人物および動物画像アニメーション技術

•人物アニメーション•音声駆動

Hallo2 — 高解像度、長時間の音声駆動による人物画像アニメーション技術

•人物アニメーション•音声駆動

Loopyモデル — Loopyは、音声のみで駆動する肖像画アバターで、リアルな動きを実現します。

•音声駆動•肖像画生成

EchoMimic — リアルな動的人物動画を生成する先進技術

•人物アニメーション•音声駆動

Mailgo — AI駆動の高到達率コールドメールマーケティングツール。

•コールドメール•人工知能

OpenAI Codex CLI — ターミナルで動作する軽量なコーディングエージェント。

プログラミング

•人工知能•プログラミングツール

Liquid — 視覚理解と生成を統合したマルチモーダル生成モデルです。

•マルチモーダル•生成モデル

HiDream — 全編日本語で使いやすいAIGC創作プラットフォーム。創造力の向上を支援します。

•AIGC•創作プラットフォーム

GLM-4-32B — 様々な自然言語処理タスクに対応した強力な言語モデルです。

中国セレクション

•自然言語処理•深層学習

GenPRM — 生成推論によってプロセス報酬モデルのテスト時間計算を拡大します。

•プロセス報酬モデル•生成推論

Amazon Nova Sonic — Amazonの新しい基盤モデルは、トーン、イントネーション、リズムを理解し、人と機械の会話の自然さを向上させます。

•音声認識•人工知能

HeroUI Chat — AIを活用して、あなたのアイデアを現実のものにし、美しいアプリケーションを生成します。

•人工知能•アプリケーション生成

Agno — 多様なモダリティを持つエージェントを構築するための軽量ライブラリです。

•マルチモーダルエージェント•オープンソース

AccVideo — ビデオ拡散モデルの高速化を実現し、生成速度を8.5倍向上させました。

•動画生成•人工知能

Video-T1 — テスト時間スケーリングにより、動画生成の品質が大幅に向上します。

•動画生成•テスト時間スケーリング

Fin-R1 — 強化学習によって駆動される金融推論の大規模言語モデル。

•金融•人工知能

混元T1 — 業界をリードする深層推論大規模モデルで、人間の好みを最適化しています。

中国セレクション

•深層学習•推論モデル

o1-pro — o1-proモデルは強化学習により複雑な推論能力を向上させ、より最適な回答を提供します。

世界的トレンド

•人工知能•自然言語処理

Orpheus TTS — 人間の音声の自然さを目指したオープンソースのテキスト読み上げシステムです。

•テキスト読み上げ•オープンソース

Mistral Small 3.1 — テキストとビジョンタスク処理能力を強化したオープンソースモデル。

•マルチモーダル•テキスト処理

Cohere Command — Cohere Commandは、企業向けに設計された高性能な言語モデルです。

•企業•人工知能

OpenJobs AI — ユーザーの求職を支援するインテリジェントなプラットフォームです。

•就職活動•人工知能

Cal AI アプリ — 写真を撮るだけで簡単にカロリーをトラッキングできます。

•カロリートラッキング•健康的な食事

Light-R1 — Light-R1は、長鎖推論（Long COT）に特化したオープンソースプロジェクトであり、コース形式のSFT、DPO、RLを用いてゼロから訓練する方法を提供します。

プログラミング

•人工知能•長鎖推論

Gemini Robotics — Gemini 2.0ベースのロボットモデル。AIを物理世界にもたらし、視覚、言語、動作能力を備えています。

国際セレクション

•人工知能•ロボット

Sesame CSM — テキストと音声入力から高品質の音声を生成する、対話型音声生成モデルです。

•音声合成•人工知能

AISFXGen — AISFXGenは、AI技術に基づいた音響効果生成ツールで、テキストとビデオからの音響効果生成に対応しています。

•AI音響効果•ビデオ制作

理想同学ウェブ版 — 理想同学はインテリジェントなチャットアシスタントであり、便利な会話サービスとインテリジェントなインタラクション体験を提供します。

中国セレクション

•インテリジェントチャット•人工知能

Sudowrite Muse — フィクションライティング用に設計されたAIモデルで、作者が高品質の小説コンテンツを作成するのに役立ちます。

•人工知能•ライティングアシスタント