Best 实时语音交互 AI Tools & Models - Premium 实时语音交互 News

AI News

阿里通义推出Qwen3-Omni-Flash-2025-12-01

阿里通义Qwen团队发布新版Qwen3-Omni-Flash-2025-12-01，作为新一代全模态大模型，能高效处理文本、图像、音频和视频输入，实现实时流式响应，生成文本与自然语音输出。升级重点提升了音视频交互体验，增强了对音视频指令的理解和执行能力，优化了口语化场景中的表现。

12k 21 minutes ago

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

阿里巴巴发布新一代全模态大模型Qwen3-Omni-Flash-2025-12-01，支持文本、图像、音频和视频的无缝输入，并能实时流式同步生成高质量文本与自然语音，语音自然度接近真人。该模型采用实时流式架构，支持119种文本语言交互。

11.5k 1 hours ago

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

Meta 收购 AI 可穿戴公司 Limitless，助力智能硬件创新

Meta收购AI可穿戴设备公司Limitless，其智能吊坠支持语音交互、实时录音转录和语音搜索，旨在提升用户专注力和记忆力。Limitless团队将加入Meta开发下一代AI硬件，此前Meta已进行战略调整。

11.3k 6 hours ago

1999元起！理想AI眼镜 Livis首发：AI大模型首出车舱

理想汽车发布AI眼镜Livis，搭载自研AI助手“理想同学”，支持语音交互、实时翻译等功能，售价1999元起。

10.6k 2 hours ago

AI Products

ZEGOCLOUD

提供语音、视频和聊天API，用于实时交互，加速应用增长。

开发平台

7.6k

SpeechGPT 2.0-preview

首个面向语境智能的人类级实时交互系统，支持多情感、多风格语音交互。

语音转文本

9.9k

VITA-1.5

VITA-1.5: 实时视觉和语音交互的GPT-4o级多模态大语言模型

AI模型

9.5k

VideoChat

实时语音交互数字人，支持端到端语音方案

聊天机器人

12.2k

Models

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

qwen3-tts-flash-realtime

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-tts-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Doubao-Seed-1.6-flash

Bytedance

$0.15

Input tokens/M

$1.5

Output tokens/M

256

Context Length

qwen3-asr-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

百度蒸汽机2.0音视一体

Baidu

Input tokens/M

Output tokens/M

Context Length

GPT-5 nano

Openai

$0.35

Input tokens/M

$2.8

Output tokens/M

400

Context Length

qwen-tts-realtime

Alibaba

$2.4

Input tokens/M

$12

Output tokens/M

Context Length

Hunyuan-TurboS-latest

Tencent

$0.8

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-thinking-vision-pro

Bytedance

Input tokens/M

Output tokens/M

128

Context Length

Gemma 3n E2B

Google

Input tokens/M

Output tokens/M

Context Length

qwen-tts

Alibaba

$1.6

Input tokens/M

$10

Output tokens/M

Context Length

Gemma 3n E4B Instructed LiteRT Preview

Google

Input tokens/M

Output tokens/M

Context Length

qwen-omni-turbo-realtime

Alibaba

Input tokens/M

$6.4

Output tokens/M

Context Length

MCP

Voice Mcp

一个支持与Claude等LLM进行语音交互的MCP服务器，只需OpenAI API密钥和麦克风/扬声器即可实现实时语音对话。

python

7.6k

2.5points

Speech Mcp

Speech MCP是为Goose设计的语音交互扩展，提供实时语音识别、高质量文本转语音、多语言支持和现代化音频可视化界面，支持多角色对话生成和音频转录功能。

python

9.7k

2.5points

Speech Interface (Faster Whisper)

Speech MCP 是一个为Goose设计的语音交互扩展，提供实时语音识别、文本转语音和音频可视化功能。

python

6.3k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

阿里通义推出Qwen3-Omni-Flash-2025-12-01

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

Meta 收购 AI 可穿戴公司 Limitless，助力智能硬件创新

1999元起！理想AI眼镜 Livis首发：AI大模型首出车舱

AI Products

ZEGOCLOUD

SpeechGPT 2.0-preview

VITA-1.5

VideoChat

Models

Claude Haiku 4.5

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

qwen3-livetranslate-flaltimeash-re-2025-09-22

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

qwen3-tts-flash-realtime

qwen3-tts-flash

Doubao-1.5-pro-32k

Doubao-Seed-1.6-flash

qwen3-asr-flash

百度蒸汽机2.0音视一体

GPT-5 nano

qwen-tts-realtime

Hunyuan-TurboS-latest

Doubao-1.5-thinking-vision-pro

Gemma 3n E2B

qwen-tts

Gemma 3n E4B Instructed LiteRT Preview

qwen-omni-turbo-realtime

Voila Autonomous Preview

Voila Audio Alpha

VITA 1.5

MCP

Voice Mcp

Speech Mcp

Speech Interface (Faster Whisper)

AI News

​阿里通义推出Qwen3-Omni-Flash-2025-12-01

阿里发布全模态大模型Qwen3-Omni-Flash：实时流式输出，支持 119 种语言交互

​Meta 收购 AI 可穿戴公司 Limitless，助力智能硬件创新

1999元起！理想AI眼镜 Livis首发：AI大模型首出车舱

AI Products

ZEGOCLOUD

SpeechGPT 2.0-preview

VITA-1.5

VideoChat

Models

Claude Haiku 4.5

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

qwen3-livetranslate-flaltimeash-re-2025-09-22

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

qwen3-tts-flash-realtime

qwen3-tts-flash

Doubao-1.5-pro-32k

Doubao-Seed-1.6-flash

qwen3-asr-flash

百度蒸汽机2.0音视一体

GPT-5 nano

qwen-tts-realtime

Hunyuan-TurboS-latest

Doubao-1.5-thinking-vision-pro

Gemma 3n E2B

qwen-tts

Gemma 3n E4B Instructed LiteRT Preview

qwen-omni-turbo-realtime

Voila Autonomous Preview

Voila Audio Alpha

VITA 1.5

MCP

Voice Mcp

Speech Mcp

Speech Interface (Faster Whisper)

阿里通义推出Qwen3-Omni-Flash-2025-12-01

Meta 收购 AI 可穿戴公司 Limitless，助力智能硬件创新