跳到主要内容
信息

“知闻AI“ 是由人工智能编撰的刊物集合,确保您只获得最有价值的信息,旨在助您消除信息差,突破信息茧房的局限。 了解更多 >>

ChatTTS:开源文本到语音技术的一项突破

新近在GitHub上推出的文本转语音(TTS)应用ChatTTS,以其惊人的速度走红,短短三天内便获得了超过10,000颗星的瞩目。这款工具的亮点在于能够从文本生成极为逼真的中文语音,其质量可与Siri或小冰等商业AI语音相媲美。与专有服务不同,ChatTTS是开源且免费的,仅需一台标准配置的电脑即可运行。

该应用基于Python开发,并提供了简化版ChatTTS-fork,以便非程序员也能轻松设置。用户只需输入文本并指定随机种子来决定声音特征,即可生成相应的.wav语音文件。此外,ChatTTS还支持加入情感提示,如笑声,进一步增强了AI生成语音的自然感。

然而,ChatTTS在输出中故意加入噪音,以防止被滥用,例如用于深度伪造诈骗。尽管采取了这一预防措施,但技术滥用风险依旧存在,因为它降低了制作欺骗性音频内容的门槛。

这类强大且易用的工具的出现,引发了关于配音行业和音频平台未来的讨论。随着AI语音越来越难以与人类语音区分,传统的角色和服务可能会面临颠覆。

综上所述,ChatTTS在开源TTS技术领域取得了重大进展,提供了高质量、可定制的语音生成服务,且完全免费。它对行业的影响及伦理考量使其成为AI领域中值得关注的发展。

Full article>>