AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

AudioLM

高品質オーディオ生成フレームワーク

一般製品その他オーディオ生成言語モデル

ウェブサイトを開く

AudioLMはGoogle Researchが開発した、長期的な一貫性を備えた高品質オーディオ生成のためのフレームワークです。入力オーディオを離散トークンシーケンスにマッピングし、オーディオ生成をこの表現空間における言語モデリングタスクとして扱います。大量の生のオーディオ波形データで訓練することで、自然で首尾一貫したオーディオの続きを生成します。テキストや注釈がなくても、話者のアイデンティティやリズムを維持しながら、文法上および意味的に妥当な音声の続きを生成できます。さらに、訓練時に音楽記号表現を使用していなくても、首尾一貫したピアノ音楽の続きを生成できます。

AudioLM

ウェブサイトを開く

AudioLM 最新のトラフィック状況

月間総訪問数

64708

直帰率

52.63%

平均ページ/訪問

1.5

平均訪問時間

00:00:46

AudioLM 訪問数の傾向

AudioLM 訪問地理的分布

AudioLM トラフィックソース

AudioLM 代替品

AudioLM

AudioLM — 高品質オーディオ生成フレームワーク

•オーディオ生成•言語モデル

Llama 3.1 Nemotron Ultra 253B — 効率的な推論とチャットを可能にする大規模言語モデルです。

•言語モデル•推論

Fin-R1 — 強化学習によって駆動される金融推論の大規模言語モデル。

•金融•人工知能

Jamba 1.6 — AI21が提供するJamba 1.6モデルは、企業のプライベート展開向けに設計されており、優れた長テキスト処理能力を備えています。

•言語モデル•長テキスト処理

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

国際セレクション

•人工知能•言語モデル

OpenManus — OpenManusは、招待コードなしで使用できるオープンソースのインテリジェントエージェントプロジェクトです。

•オープンソース•インテリジェントエージェント

Instella — Instellaは、AMDが開発した高性能なオープンソース言語モデルであり、オープンソース言語モデルの発展を加速するために設計されています。

プログラミング

•オープンソース•言語モデル

GPT-4.5 — OpenAIが発表した最新の言語モデルGPT-4.5は、教師なし学習能力の向上に重点を置き、より自然なインタラクション体験を提供します。

世界的トレンド

•人工知能•言語モデル

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Liteは、長文処理と多様なアプリケーションシナリオ向けに最適化された、高効率な言語モデルです。

•言語モデル•長文処理

Phi-4-mini-instruct — Phi-4-mini-instructは、高品質な推論集約型データに特化した軽量のオープンソース言語モデルです。

プログラミング

•言語モデル•多言語サポート

DeepSeek 日本語版 — DeepSeekは、論理推論、数学、プログラミングタスクに秀でた高度なAI言語モデルです。無料で利用できます。

•言語モデル•プログラミング支援

AlphaMaze-v0.2-1.5B — 大規模言語モデルの視覚推論能力を向上させるための、テキスト迷路解決タスクを用いた革新的な手法

•人工知能•言語モデル

AlphaMaze — AlphaMazeは、視覚推論タスクに特化したデコーダー言語モデルであり、従来の言語モデルが視覚タスクで抱える課題を解決することを目指しています。

•視覚推論•言語モデル

Smithery — Model Context Protocolサーバーを使用して、言語モデルの機能を拡張します。

国際セレクション

•言語モデル•機能拡張

Moonlight-16B-A3B — Moonlight-16B-A3Bは、Muon最適化器を用いてトレーニングされた160億パラメータの混合専門家モデルであり、効率的な言語生成を目的としています。

•言語モデル•最適化器

DeepHermes-3-Llama-3-8B-Preview — DeepHermes 3は、推論と通常の応答モードをサポートする大規模言語モデルです。

•言語モデル•推論

Lora — Loraは、iOSとAndroidに対応したモバイルデバイス向けに最適化されたローカル言語モデルです。

プログラミング

•モバイルデバイス•言語モデル

PaliGemma 2 mix — PaliGemma 2 mixは、多様なタスクと分野に適用可能な多機能ビジュアル言語モデルです。

国際セレクション

•画像認識•言語モデル

Mistral Saba — Mistral Sabaは、中東および南アジア地域向けにカスタマイズされた地域言語モデルです。

•言語モデル•地域カスタマイズ

OLMoEアプリ — Ai2 OLMoEは、iOSデバイスで動作するオープンソースの言語モデルアプリです。

国際セレクション

•オープンソース•言語モデル

Podscript — ポッドキャストやその他の音声ファイルの文字起こしテキストを生成するためのツールです。複数の言語モデルと音声認識APIに対応しています。

•音声文字起こし•ポッドキャスト

Xwen-Chat — Xwen-Chatは、日本語対話に特化した大規模言語モデルの集合体であり、複数バージョンのモデルと自然言語生成サービスを提供します。

•言語モデル•日本語対話

LLMコードネーム — LLMを活用した、創造的なネーミングツールです。ユーザーはこれを使って、簡単にユニークな名前を生成できます。

•創造性•ネーミング

Deeptrain — 言語モデルとAIエージェントにビデオ処理サービスを提供し、様々なビデオソースに対応しています。

•ビデオ処理•言語モデル

Exa & Deepseek チャットアプリ — ExaのAPIを用いたウェブ検索と、Deepseek R1による推論を組み合わせた、オープンソースのチャットアプリケーションです。

•オープンソース•チャット

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8Bは、テキスト生成と推論タスクに適した高性能なオープンソース言語モデルです。

•言語モデル•推論

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3 — Qwen2.5-32Bモデルをベースとした4ビット量子化バージョンです。高効率推論と低リソース環境での展開を目的として設計されています。

プログラミング

•言語モデル•量子化

ReaderLM v2 — ReaderLM v2は、HTMLをMarkdownとJSONに変換するための、最先端の小型言語モデルです。

国際セレクション

•言語モデル•データ変換

MiniMax-Text-01 — MiniMax-Text-01は、総パラメータ数4,560億、最大400万トークンのコンテキストを処理可能な強力な言語モデルです。

•言語モデル•テキスト生成

MiniMax-01 — 4,560億パラメーターを持つ強力な言語モデルで、最大400万トークンのコンテキストを処理可能です。

プログラミング

•人工知能•言語モデル