文本转语音(text-to-speech; TTS)是一种语音合成应用程序,它可以处理文本并用人类的声音朗读出来。人工智能(AI)的兴起带来了令人难以置信的各种文本转语音生成器。 TTS 生成器在各个领域都得到广泛应用,它可以当小助手帮你念书、读邮件,也可以作为教学辅助工具,还可以为企业和个人创作者快速制作配音、或者电子书、英语播客,对于母语并非英语的推广团队来说真是太实用了!
市场上有许多优秀的文本转语音生成器,每款都有独特的功能和应用。下面我们介绍 5 款我们认为最好,以及另外 20 多款反响也不错的文本转语音生成器工具。
Speechify
Speechify 是一款领先的文字转语音软件,也是我们最推荐的一款。它以其自然、灵活的声音和免费计划而受到用户的喜爱。它的主要功能是将各种形式的文本(包括文档、网页、 PDF 、电子邮件等)转化为高质量的 AI 声音。此外,Speechify 还可以在网站和应用程序的各种内容中添加「播放按钮」,用户可以直接听取内容。 Speechify 有 Chromb 扩展、 iOS 版本、 Android 版本、 Mac 版本和网页版。

优点
- 有免费版
- 可在多种设备上使用并保存音频,如 iOS, Android, Mac, PC
- 60+种语言,超过 30 种自然发音的男性和女性的声音
- 可调节语调、停顿
- 长达 100 小时语音生成,无限下载生成的音频
- 8,000+ 背景音乐
- 可扫描印刷文本并转换成语音
缺点
- 高级声音有每月 15 万字的限制
Speechify 的声音非常自然,流畅,就像真人的声音一样,不会出现奇怪的语调。 Speechify 提供了超过 30 种自然发音的男性和女性的声音供用户选择。这些声音的质量都非常高,让人感觉就像是有人在旁边为你朗读一样。
此外,Speechify 还支持超过 15 种语言,这使得它可以满足各种不同语言背景的用户的需求。无论你的母语是什么,或者你想听取哪种语言的内容,Speechify 都可以帮助你。我测试了中文阅读,语音、语调、节奏都十分自然,对于多音字也能很好地根据上下文选择出正确的读音。
另一个值得一提的功能是,Speechify 可以扫描并将印刷文本转换为语音。这意味着你可以拍摄一张书页或者报纸的照片,然后让 Speechify 将其转化为语音,这无疑为用户提供了极大的便利。
然而,尽管 Speechify 有很多优点,但它也有一些缺点。 Speechify 的高级语音,每月有 150,000 字的限制,因此不适合大量阅读书籍。超过这个限制后,用户只能得到标准语音。高级语音更加抑扬顿挫、有节奏和语调,标准语音则是 Google 音库的棒读语音。如果你的阅读需求主要是邮件、新闻、备忘录等较短的文本,或者你不介意听标准语音,那么 Speechify 将是一个很好的选择。
在定价方面,Speechify 提供了三种计划。首先是免费计划,这是一个基础版本,适合刚开始使用 TTS 软件的人,仅有基本的文本转换成语音功能。其次是 Speechify Premium,每年 139 美元,用户可以享受 Speechify 的全部功能,并有长达 100 小时的语音生成。最后是 Speechify 有声书,每年 199 美元,适合希望获取由专业演员朗读的有声书的读者,还附送超过 1,000 本有声书。
Synthesys
Synthesys 是一款强大的人工智能文本转语音生成器,它可以从文本中创建自然声的语音,适合用于广泛的商业用途,特别是配音。用户可以选择性别、风格、口音和音调,然后将想要转换为语音的文本粘贴或写入 Synthesys 的人工智能语音生成界面。在设置阅读速度和停顿长度后,只需点击「创建」,就可以在几分钟内生成人工语音。

优点
- 254 种声音,66+种语言
- 真实人声英语音库
- 超级友好的用户界面
- 直接选择不同口音、风格、语调
缺点
- 没有免费试用
- 除英语外,其他语言没有真人音库(多数声音还是很自然的)
Synthesys 的特点包括基于云的应用程序、庞大的专业和自然声音库(超过 35 种女性声音和 30 种男性声音)、创建和销售无限的声音,以及极其友好的界面。它的语音配音的逼真程度令人惊叹,有大量的声音和语言选择。你可以在 66+种语言中获得 254 种合成声音。虽然没有免费版,它可以无限数量、无限时间地制作语音配音,因此价格也不算贵。
然而,Synthesys 的一个小缺点是真实的人声音库只有英语,其他声音都是 AI 合成。比如中文,听起来就有点失真,像顶流烂歌手经过调音的声音。另外,文本框内只能输入 5,000 字母,合成一段短音频,但你可以一键将多个短音频合并为一个长音频。
Synthesys 最适合想要为他们的品牌、营销、社交媒体或任何其他目的创建语音配音的人。它不需要任何特殊技能,使用起来非常直观。你只需选择性别、口音、风格、语调,它会处理剩下的事情。你的第一次尝试可能就非常准确,可以直接用了。
在定价方面,Synthesys 提供三种定价计划:音频合成每月 29 美元,可以无限下载 AI 语音配音;视频合成每月 39 美元,可以无限制制作 AI 视频;音频+视频合成打包价每月 59 美元,可以使用 “音频” 和 “视频” 计划,打包价等于分别购买的 8 折哦。如果一次订阅一年还有额外 8 折。
Murf
Murf 是一款高级的人工智能语音生成器,它可以将文本转换为逼真的语音,适用于各种专业人士,包括产品开发人员、播客、教育工作者和商业领袖。 Murf 提供了大量的定制选项,包括各种声音和方言,以及一个易于使用的界面,使用户能够创建最佳的自然声音。

优点
- 可以用自己的声音生成配音
- 可直接选择声音角色,如作家、教练、客服等
- 20+种语言,120+种声音
- 可直接编辑视频
缺点
- 收费版每月有 24/48 小时的语音创作限制
Murf 的主要功能包括一个全面的人工智能配音工作室,内置视频编辑器,以及超过 20 种语言、 120+种人工智能声音。此外,Murf 还提供了一个变声器功能,允许用户上传自己的录音,然后通过音调、速度和音量来定制自己的配音,添加停顿和强调,或改变发音。
Murf 的特点包括从文本中生成配音,将声音转换成可编辑的文本,以及将配音时间与视觉效果同步。你也可以试用 Murf 提供的现成的视频模板。此外,Murf 还提供了一些高级功能,如用语法助手检查脚本,添加免费的背景音乐,修剪视频和音乐等。
在价格方面,Murf 提供了四个定价计划,包括免费、基本(每月 19 美元)、专业(每月 26 美元)和企业(每月 99 美元以上)。这些计划提供了不同的功能和服务,包括无限下载、访问所有声音和语言、 24/48 小时语音生成时间、协作工作空间、 AI 变声器、商业使用权、许可音轨、高优先级支持等。对于需要大规模扩展的公司,企业计划提供了无限的语音生成、转录和存储、协作和访问控制、专用账户经理、服务协议、单点登录(SSO)、培训和入职支持、 PO 和发票、删除恢复等功能。
Speechelo
如果你追求高性价比,Speechelo 非常符合这个需求,它简单、快速、经济,能够将文本转换为自然人声的语音配音,广泛应用于销售视频、培训视频、教育视频等。

优点
- 一次付费,终身使用
- 30+种声音、 23 种语言
缺点
- 没有免费试用
Speechelo 的主要特点包括一次性付费、 60 天退款保证、 30+种声音、 23 种语言选择以及简单易用的操作界面。用户只需将文本粘贴到在线文本转语音工具中,选择所需的声音,然后点击「生成语音」按钮,Speechelo 就能为用户创建语音配音。然后下载音频,再将其导入自己常用的视频编辑器进行编辑。
此外,Speechelo 还具有调整语音音调、速度和音量的功能,用户可以根据需要添加呼吸声、暂停等,更加像真人了。它与几乎所有的视频创作软件兼容,如 Camatasia, Adobe, Premier, iMovie 等。它还有三种语气来阅读文本,正常语气、欢乐语气和严肃语气。
Speechelo 仅需一次性 47 美元的费用,即可终生使用。
Amazon Polly
Amazon Polly 是一个强大的云服务,它使用先进的深度学习技术将文本转换为逼真的语音。这款产品的最大优点是其强大的 API,开发者可以将其集成到应用、网站或其他产品中,使其具有语音功能。然而,对于非技术人员来说,使用 Amazon Polly 可能会有些困难。

优点
- 支持多种文档
- 可以集成到你自己的应用程序或网站中
- 价格便宜,第一年有免费级别
缺点
- 需要亚马逊账号
- 不适合非技术人员
Amazon Polly 提供了 50 多种声音和 25 种语言供用户选择,你可以根据需要选择男性或女性的声音,选择不同的口音和语调。此外,它还支持 Speech Synthesis Markup Language (SSML),用户可以通过它来控制语音的语调、速度和音量。 Amazon Polly 支持多种音频格式,包括 MP3 、 OGG 和 PCM,可以根据需要将语音保存为不同的格式。
Amazon Polly 不仅仅是一个文本转语音的工具,它还可以让你轻松地将语音合成功能整合到电子书、文章和其他媒体中。你只需通过 API 发送文本,它就会把音频流直接送回你的应用程序。
在定价方面,Amazon Polly 采取按使用量计费的方式,第一年每月免费提供 500 万个字符,免费级别用完后,每 100 万字符的语音或语音标记请求为 4 美元。如果你是一个开发者,需要一个强大的 API 来将文本转换为语音,那么 Amazon Polly 是一个不错的选择。与之相似的还有 Google Cloud Text-to-Speech 和 Microsoft Azure Text to Speech 。
其他 20 款 TTS 工具
其实 TTS 工具还有很多很多,我自己在用的是 Chrome 扩展 ReadAloud 和手机应用程序 Audify 。它们都符合我的需求:1. 免费;2. 能为我阅读网页内容。如果你有制作视频音频、配音的需求,上面介绍的 5 种 TTS 工具和下面的更多选择,一定能找到适合的!
Synthesia |
|
Natural Reader |
|
Audify |
|
ReadAloud |
|
Google Cloud Text-to-Speech |
|
IBM Watson Text to Speech |
|
Descript |
|
Notevibes |
|
Microsoft Azure Text to Speech |
|
Voice Dream Reader |
|
From Text to Speech |
|
LOVO Studio |
|
Play.ht |
|
Listen2It |
|
Speechactors |
|
Xpeacho |
|
BeyondWords |
|
Immersive Reader |
|
Select and Speak |
|
Wellsaid |
|
发表评论