15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型

OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。

OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。

OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespan 等公司开放访问。

在 OpenAI 发布的这些样本中,你可以听到 Age of Learning 利用该技术生成预制 voice-over 内容,以及向学生朗读由 GPT-4 撰写的“实时、个性化回复”。

IT之家附上参考地址

  • Navigating the Challenges and Opportunities of Synthetic Voices

本文转载自IT之家,转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请联系IT之家通知我方删除,我方将在收到通知后第一时间删除内容!本文只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1