AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

LLaVA-OneVision

多様なモダリティを扱うビジョンタスクのための高効率変換モデル

一般製品画像多様なモダリティ視覚認識

ウェブサイトを開く

LLaVA-OneVisionは、バイトダンス社と複数の大学との共同開発による大規模多様なモダリティモデル（LMMs）です。単一画像、複数画像、動画の各シーンにおいて、オープンな大規模多様なモダリティモデルのパフォーマンス限界を押し広げています。本モデルは、異なるモダリティ／シーン間での強力な転移学習を可能にする設計となっており、特に動画理解やシーン横断能力において新たな総合的な能力を示しています。これは、画像から動画へのタスク変換によって実証されています。

LLaVA-OneVision

ウェブサイトを開く

LLaVA-OneVision 最新のトラフィック状況

月間総訪問数

68381

直帰率

51.61%

平均ページ/訪問

1.2

平均訪問時間

00:00:15

LLaVA-OneVision 訪問数の傾向

LLaVA-OneVision 訪問地理的分布

LLaVA-OneVision トラフィックソース

LLaVA-OneVision 代替品

LLaVA-OneVision — 多様なモダリティを扱うビジョンタスクのための高効率変換モデル

•多様なモダリティ•視覚認識

人類最後の試験 (Humanity's Last Exam) — 人類最後の試験 (Humanity's Last Exam) は、大規模言語モデルの能力を測るための多様なモダリティを含むベンチマークテストです。

•人工知能•ベンチマークテスト

InternVL2_5-4B-MPO-AWQ — 画像とテキストの相互作用能力を最適化した多様なモダリティを持つ大規模言語モデル

•多様なモダリティ•大規模言語モデル

理想同学 — いつでもどこでもあなたに寄り添うインテリジェントアシスタント

中国セレクション

•人工知能•知識応答

WePOINTS — WePOINTSプロジェクトは、多様なモダリティに対応するモデルのための統一フレームワークを提供します。

プログラミング

•多様なモダリティ•人工知能

OpenAI Codex CLI — ターミナルで動作する軽量なコーディングエージェント。

プログラミング

•人工知能•プログラミングツール

Liquid — 視覚理解と生成を統合したマルチモーダル生成モデルです。

•マルチモーダル•生成モデル

HiDream — 全編日本語で使いやすいAIGC創作プラットフォーム。創造力の向上を支援します。

•AIGC•創作プラットフォーム

GLM-4-32B — 様々な自然言語処理タスクに対応した強力な言語モデルです。

中国セレクション

•自然言語処理•深層学習

GenPRM — 生成推論によってプロセス報酬モデルのテスト時間計算を拡大します。

•プロセス報酬モデル•生成推論

Amazon Nova Sonic — Amazonの新しい基盤モデルは、トーン、イントネーション、リズムを理解し、人と機械の会話の自然さを向上させます。

•音声認識•人工知能

HeroUI Chat — AIを活用して、あなたのアイデアを現実のものにし、美しいアプリケーションを生成します。

•人工知能•アプリケーション生成

Agno — 多様なモダリティを持つエージェントを構築するための軽量ライブラリです。

•マルチモーダルエージェント•オープンソース

AccVideo — ビデオ拡散モデルの高速化を実現し、生成速度を8.5倍向上させました。

•動画生成•人工知能

Video-T1 — テスト時間スケーリングにより、動画生成の品質が大幅に向上します。

•動画生成•テスト時間スケーリング

Fin-R1 — 強化学習によって駆動される金融推論の大規模言語モデル。

•金融•人工知能

混元T1 — 業界をリードする深層推論大規模モデルで、人間の好みを最適化しています。

中国セレクション

•深層学習•推論モデル

o1-pro — o1-proモデルは強化学習により複雑な推論能力を向上させ、より最適な回答を提供します。

世界的トレンド

•人工知能•自然言語処理

Orpheus TTS — 人間の音声の自然さを目指したオープンソースのテキスト読み上げシステムです。

•テキスト読み上げ•オープンソース

Mistral Small 3.1 — テキストとビジョンタスク処理能力を強化したオープンソースモデル。

•マルチモーダル•テキスト処理

Cohere Command — Cohere Commandは、企業向けに設計された高性能な言語モデルです。

•企業•人工知能

OpenJobs AI — ユーザーの求職を支援するインテリジェントなプラットフォームです。

•就職活動•人工知能

Cal AI アプリ — 写真を撮るだけで簡単にカロリーをトラッキングできます。

•カロリートラッキング•健康的な食事

Light-R1 — Light-R1は、長鎖推論（Long COT）に特化したオープンソースプロジェクトであり、コース形式のSFT、DPO、RLを用いてゼロから訓練する方法を提供します。

プログラミング

•人工知能•長鎖推論

Gemini Robotics — Gemini 2.0ベースのロボットモデル。AIを物理世界にもたらし、視覚、言語、動作能力を備えています。

国際セレクション

•人工知能•ロボット

Sesame CSM — テキストと音声入力から高品質の音声を生成する、対話型音声生成モデルです。

•音声合成•人工知能

AISFXGen — AISFXGenは、AI技術に基づいた音響効果生成ツールで、テキストとビデオからの音響効果生成に対応しています。

•AI音響効果•ビデオ制作

理想同学ウェブ版 — 理想同学はインテリジェントなチャットアシスタントであり、便利な会話サービスとインテリジェントなインタラクション体験を提供します。

中国セレクション

•インテリジェントチャット•人工知能

Sudowrite Muse — フィクションライティング用に設計されたAIモデルで、作者が高品質の小説コンテンツを作成するのに役立ちます。

•人工知能•ライティングアシスタント

Selene API — Selene APIは、AIアプリケーションのパフォーマンスを評価するための高度なツールであり、正確なスコアとフィードバックを提供します。

プログラミング

•人工知能•評価