Best AI Websites & Tools
zh
AI产品榜
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
首页
AI资讯
AI日报
变现指南
AI教程
AI工具导航
AI产品库
zh
AI产品榜
SpeechEvalPro API
高质量、多维度中英文发音评测API
普通产品
教育
发音评测
语音识别
打开网站
语音评测API是基于自主研发的教育语音AI模型,集成语音评测、语音识别等核心技术,提供高质量、多维度的中英文发音评测API,帮助客户创建智能学习产品,实现人机交互。产品特点:核心专利技术,AI模型稳定可靠,丰富的评测维度,包括完整性、准确性、流利度等。定价策略包括免费试用、专业版和企业版。支持各类评测场景,如作业和考试。支持HTTP和WebSocket协议。
网站截图
产品特色
需求人群
使用示例
使用教程
打开网站
真实数据标注
真实数据模型训练
多维度评测
支持语音和文本输入
支持中英文评测
支持不同评测场景
适用于教育行业,可用于智能学习产品的发音评测功能
打开网站
SpeechEvalPro API 替代品
whisper-ner-v1
— 联合语音转录和实体识别的先进模型
生产力
•
语音识别
•
实体识别
24
ultravox-v0_4_1-mistral-nemo
— 多模态语音大型语言模型
生产力
•
语音识别
•
语音翻译
72
ultravox-v0_4_1-llama-3_1-70b
— 多模态语音大型语言模型
生产力
•
语音识别
•
文本生成
30
ultravox-v0_4_1-llama-3_1-8b
— 多模态语音大型语言模型
生产力
•
语音识别
•
语音翻译
30
Ultravox.ai
— 下一代语音AI,打造自然沟通的AI语音代理。
编程
•
AI语音
•
自然语言处理
186
卡卡字幕助手
— 基于LLM的智能字幕助手,一键生成高质量视频字幕
视频
•
字幕生成
•
语音识别
156
Najva
— Najva:您的AI驱动的Mac语音助手,将语音快速转换为文本。
生产力
•
语音识别
•
Mac应用
72
hertz-dev
— 开源的全双工音频生成基础模型
编程
•
音频处理
•
语音识别
84
Transcribro
— Android平台上的私有、设备端语音识别键盘和文字服务
生产力
•
Android
•
语音识别
132
Universal-2
— 下一代语音AI,提供卓越的音频数据处理能力。
生产力
•
语音识别
•
音频处理
42
GLM-4-Voice
— 端到端中英语音对话模型
生产力
•
语音识别
•
语音合成
228
Whispo
— AI驱动的语音听写工具
生产力
•
语音识别
•
听写
84
Spirit LM
— 多模态语言模型,融合文本和语音
生产力
•
多模态
•
语言模型
66
FunASR
— 功能强大的语音离线文件转写服务
生产力
•
语音识别
•
语音转写
156
AsrTools
— 智能语音转文字工具,高效且用户友好。
生产力
•
语音识别
•
ASR服务
150
NotesGPT
— AI驱动的语音笔记应用,将语音转换为有组织的摘要和清晰的行动项。
国外精选
•
语音识别
•
笔记管理
324
Reverb
— 开源的语音识别和说话人分割模型推理代码
编程
•
语音识别
•
说话人分割
210
Rev AI
— 世界最精确的AI语音转录服务
国外精选
•
语音识别
•
转录服务
150
AI-Powered Meeting Summarizer
— 会议语音转文本并自动生成摘要的AI工具
生产力
•
语音识别
•
文本摘要
132
EMOVA
— 情感丰富的多模态语言模型
其他
•
多模态
•
语音识别
138
OmniSenseVoice
— 极速语音识别,精准时间戳
生产力
•
语音识别
•
时间戳
342
Deepgram Voice Agent API
— 实时对话式人工智能,一键式API接入。
编程
•
语音识别
•
语音合成
354
讯飞星火
— 全面对标GPT-4 Turbo的AI大语言模型
中文精选
•
大模型
•
自然语言处理
324
讯飞虚拟人
— 全栈式虚拟人多场景应用服务
中文精选
•
AI虚拟形象
•
语音识别
270
EVI 2
— 新型基础语音对语音模型,提供人性化对话体验。
聊天
•
语音识别
•
情感智能
126
心辰Lingo语音大模型
— 沟通无界,让每次对话都创造价值。
中文精选
•
语音识别
•
自然语言处理
222
聆龙
— AI笔记助手,记录、整理、对话,让知识管理更智能。
中文精选
•
AI笔记
•
知识管理
186
Aixploria
— AI工具目录,发现最佳AI工具
生产力
•
AI工具
•
AI导航
258
Mini-Omni
— 开源多模态大型语言模型,支持实时语音输入和流式音频输出。
生产力
•
多模态
•
语音识别
432