站点介绍
这个文字转语音是目前为止我觉得转换的最有感觉的一种,无论是语气还是自行添加的语气助词,都是相当到位的,不过经过几番调试,还是发现了一下小的问题和限制,会在文章最后说明。
站点默认全英文,但是演示视频来自B站,已经深深地出卖了自己,首页右上角选择中文可以进行语言切换:
首页其余的内容没啥好看的,基本都是介绍,我们主要看下面这个区域:
这个区域就是用来进行转换的主要区域,看界面,你就知道哪里输入文本了,下面的设置使用默认的或者随机获取一个也可以,主要是用来针对语音进行一些特殊的设置。
比如Refine text就是在你原有的文本基础上面进行一些细微的修改,来让这段文字更加具有亲和力,或者说听起来更像正常对话一样。
恕我没有文采,我这边没有办法通过语言进行描述,下面是我切换不同参数之后的效果,每个音频都是基于默认配置(进入页面后未修改的配置)单独修改其中一项之后的结果,具体差别大家自行感受一下。
上方以“Audio temperature-0.6”为例,即将Audio temperature的参数值修改为0.6之后的结果,具体的大家自行感受。
个人感觉,站点给出的默认配置已经就很好了,如果你觉得不太行,可以根据自己的感受去调整。
站点声明该项目约通过10万小时的中文和英文数据使进行训练之后让语音合成质量高、发音自然。
经过测试,发现该转换支持中文中掺杂英文的同时也可以无缝衔接,没有任何违和感。
额外补充
通过使用了几十次之后下面这些感受,仅供给大家参考。
1、生成的音频时间不能超过30秒,大家根据这个时间结合语速调整文字数量,当文字数量大幅超过将导致音频异常。
2、部分[uv_break]之后,可能会存在一些杂音或者爆音。
3、如果你的文本中存在冒号或者很奇怪的标点符号,可能会转换成奇怪的内容。
4、针对方言性的内容,转换显得比较无力:
目前没有发现别的什么问题,如果你对于这个项目感兴趣,可以前往官网,有不少用户提供了很多有价值的内容,包含各种不错的音色等。
插几句题外话,现在AI这么发达,不知道是好事还是坏事,以该项目为例,至少有一部分通过声音赚钱的朋友可能面临窘境,然后做坏事的人又多了一个选择,只能说,科技进步的同时,我们的防骗意识也需要进步。
最后附上来自B站的一个效果测试,简直炸裂: