OpenAI 重磅升级实时 API：除了降价超50%，还推五种新语音

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月31号 9:15

236

今天，OpenAI 宣布对其实时 API 进行更新，目前该 API 仍处于测试阶段。这次更新的亮点在于推出了五种新的语音选项，专为语音到语音应用而设计，同时还降低了相关的缓存费用，让开发者在使用时更加经济实惠。

在新推出的五种语音中，OpenAI 在 X 上的一篇文章中展示了其中三种新声音，Ash、Verse 和听起来像英国的 Ballad。这些声音不仅更加生动和可调节，还能够提供更自然的交流体验。OpenAI 在其 API 文档中提到，这项原生的语音到语音功能省去了中间的文本格式处理，从而实现了低延迟和更具细腻度的输出。

不过，OpenAI 也提醒用户，由于实时 API 目前仍在测试阶段，因此暂时无法提供客户端的身份验证。此外，实时音频处理可能会受到网络条件的影响，这也给大规模传输音频带来了挑战。OpenAI 指出，当网络条件不稳定时，确保音频可靠传输的确是一项艰巨的任务。

OpenAI 在语音技术上的发展历程也颇具争议。今年三月，他们推出了 “Voice Engine” 这一语音克隆平台，试图与 ElevenLabs 竞争，但仅对少数研究者开放。随着 GPT-4o 和语音模式的演示，OpenAI 在五月暂停了名为 “Sky” 的语音使用，因为好莱坞女星斯嘉丽・约翰逊对此表达了不满，认为其与她的声音过于相似。

在九月份，OpenAI 为其付费订阅用户推出了 ChatGPT 高级语音模式，包括 ChatGPT Plus、Enterprise、Teams 和 Edu 等用户都可以使用。通过这种语音到语音的技术，企业可以更快速地生成实时响应，极大提升客户服务的效率。

降低成本，超50%

关于实时 API 的定价问题，OpenAI 在之前的发布中定价为分钟音频输入0.06美元，音频输出0.24美元，这样的费用对于开发者来说相对较高。不过，这次更新后，使用缓存的文本输入费用将降低50%，而缓存的音频输入费用则高达80% 的折扣。

OpenAI 在开发者日中宣布了 “Prompt Caching” 这一新功能，能够将频繁请求的上下文提示保存在模型的记忆中，从而减少生成响应时所需的 token 数量。通过降低输入价格，OpenAI 希望吸引更多的开发者使用其 API。

此外，其他公司如 Anthropic 也推出了类似的缓存功能，以提高其语音技术的吸引力。

划重点:
🌟 新增五种自然语音，提升语音应用体验
💰 实时 API 通过缓存降低输入费用，开发者更划算
⚡ 实时音频处理受网络条件影响，可靠性需关注

OpenAI o3 模型：每个任务消耗相当于五箱油的能源

随着人工智能的不断进步，创新与可持续发展之间的平衡成为了一项重要挑战。最近，OpenAI 推出了其最新的 AI 模型 o3，这是迄今为止最强大的模型。然而，除了运行这些模型的成本外，其对环境的影响也引起了广泛关注。一项研究显示，每个 o3任务大约消耗1，785千瓦时的电能，这相当于一个美国普通家庭在两个月内的用电量。根据 Salesforce 的 AI 可持续发展负责人 Boris Gamazaychikov 的分析，这一电能消耗大约对应684千克的二氧化碳当量排放，这与五箱满油的汽油的碳排放量相当。o3的高计算

AI赛道加速商业化：OpenAI的转型困境与突围之路

一场意外的人事变动，让OpenAI首席产品官Kevin Weil临时登上了旧金山万豪酒店的演讲台。这位曾在Twitter和Instagram创造商业奇迹的硅谷产品大师，如今肩负着OpenAI商业化转型的重任。而就在几天前，公司CTO Mira Murati的突然离职，再次将OpenAI置于风口浪尖。这起高管变动并非偶然。过去一年，OpenAI经历了一波又一波的人才流失，包括CTO、AGI就绪主管以及Sora视频生成模型的联合负责人等重量级人物相继离职。这背后折射出公司内部长期存在的理念之争:是坚持非营利性质的AI实验室初心，还是转向

OpenAI发布嵌入式SDK 2元芯片变9元，智能硬件要“炸”了！

OpenAI最新推出的Realtime Embedded SDK在业界掀起波澜，这款面向微控制器的开发工具包让人工智能与微型硬件的结合迈入新阶段。该SDK专门针对ESP32等微控制器设计，通过WiFi连接即可实现设备与云端AI模型的实时交互，大大降低了智能硬件开发的技术门槛。这一消息迅速引发市场连锁反应。ESP32相关硬件价格应声上涨，包括模组、芯片和配套的音频放大器、麦克风等设备均出现不同程度的涨价。其中音频解码芯片的价格从原来的2元飙升至9元以上，多款ESP32开发板更是出现全网断货。作为ESP32芯片

OpenAI o3发布傅盛：击败99.9%的程序员程序员将“不存在”

OpenAI在经过12天的技术分享直播活动后，于最后一天发布了其下一代推理模型o3，这是继早前发布的o1推理模型之后的升级版本。o3模型系列包括o3和o3-mini两个版本，其中o3-mini是针对特定任务进行微调的更小的精简版模型。OpenAI表示，o3模型在某些条件下可以接近实现通用人工智能（AGI），即能完成人类所能完成的任何任务的人工智能。

AI新闻资讯