Best 音效生成模型 AI Tools & Models - Premium 音效生成模型 News

AI News

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效、环境氛围

快手旗下可灵AI推出首个“音画同出”模型可灵2.6，能同时生成画面、语音、音效和环境氛围，打通音画世界。该模型提供“文生音画”和“图生音画”两种创作路径，用户可通过一句话或图片快速生成完整视频，提升创作体验。

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

爱诗科技推出PixVerse V5.5（国内版“拍我AI V5.5”），实现全量升级并开放体验。该模型是国内首个支持“多镜头+音画同步一键直出”的AI视频大模型，推动AI生成视频从“单镜头素材”进入“完整叙事短片”阶段。基于自研MVL架构，V5.5能在5-10秒内自动完成脚本拆解、分镜调度及音效生成，显著提升视频制作的完整性与效率。

11.5k 12 hours ago

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

智谱AI发布清影2.0，支持文本生成1080P高清视频，并集成CogSound模型自动添加音效，实现视听一体创作。该产品被视为国产版“Sora”，为开发者提供创新AI应用工具。

21.5k 3 hours ago

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

国产“Sora”来了！智谱清影2.0一句话生成1080P视频，还自带AI音效

智谱AI推出清影2.0，基于自研CogVideoX模型，可直接生成1080P高清视频，最长10秒。模型全面控制运动、镜头和风格，支持多视频同时生成及镜头指定。实测画质接近Sora，中文提示理解更准、生成更快。还集成CogSound音效模块，实现文本到视频的高效创作。

18.8k yesterday

AI Products

Sora 2

最新视频生成模型，更真实、可控，支持同步对话与音效。

视频生成

13.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

MaxMSP MCP Server

该项目通过Model Context Protocol（MCP）让大型语言模型直接理解和生成Max音频处理软件中的音效模块，支持解释、修改和创建音效模块，并提供与LLM的交互界面。

javascript

10.1k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效、环境氛围

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

国产“Sora”来了！智谱清影2.0一句话生成1080P视频，还自带AI音效

AI Products

Sora 2

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen-image-edit

Handler

Audio Magnet Medium

Bark Small

Tango Full

Bark

Tango

MCP

MaxMSP MCP Server

AI News

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效 、环境氛围

爱诗科技发布PixVerse V5.5：国内首个“导演级”多镜头叙事视频大模型落地

AI日报：智谱清影2.0发布；深圳上线全国首个AI智能劳动仲裁系统；1688推跨境AI智能体“遨虾”

国产“Sora”来了！智谱清影2.0一句话生成1080P视频，还自带AI音效

AI Products

Sora 2

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

wan2.5-i2i-preview

Qianfan-Lightning

qwen3-max

qwen-image-edit

Handler

Audio Magnet Medium

Bark Small

Tango Full

Bark

Tango

MCP

MaxMSP MCP Server

快手可灵 2.6 全量上线！“音画同出” ，画面、自然语音、匹配音效、环境氛围