OpenAI重磅升级实时API：除了降价超50%，还推五种新语音

文章来源：放心AI网发布时间：2025-06-07 12:32:13

今天，OpenAI 宣布对其实时 API 进行更新，目前该 API 仍处于测试阶段。这次更新的亮点在于推出了五种新的语音选项，专为语音到语音应用而设计，同时还降低了相关的缓存费用，让开发者在使用时更加经济实惠。

在新推出的五种语音中，OpenAI 在 X 上的一篇文章中展示了其中三种新声音，Ash、Verse 和听起来像英国的 Ballad。这些声音不仅更加生动和可调节，还能够提供更自然的交流体验。OpenAI 在其 API 文档中提到，这项原生的语音到语音功能省去了中间的文本格式处理，从而实现了低延迟和更具细腻度的输出。

不过，OpenAI 也提醒用户，由于实时 API 目前仍在测试阶段，因此暂时无法提供客户端的身份验证。此外，实时音频处理可能会受到网络条件的影响，这也给大规模传输音频带来了挑战。OpenAI 指出，当网络条件不稳定时，确保音频可靠传输的确是一项艰巨的任务。

OpenAI 在语音技术上的发展历程也颇具争议。今年三月，他们推出了 “Voice Engine” 这一语音克隆平台，试图与 ElevenLabs 竞争，但仅对少数研究者开放。随着 GPT-4o 和语音模式的演示，OpenAI 在五月暂停了名为 “Sky” 的语音使用，因为好莱坞女星斯嘉丽・约翰逊对此表达了不满，认为其与她的声音过于相似。

在九月份，OpenAI 为其付费订阅用户推出了 ChatGPT 高级语音模式，包括 ChatGPT Plus、Enterprise、Teams 和 Edu 等用户都可以使用。通过这种语音到语音的技术，企业可以更快速地生成实时响应，极大提升客户服务的效率。