F5-TTS-main,根据参考语音生成语音,懒人包

傻木

2024-10-24 / 0 评论 / 568 阅读 / 正在检测是否收录...

10/24

F5-TTS-main,根据参考语音生成语音

整合包制作：数字生命卡兹克

我不认识他，整合包来自群友分享，在此基础做了界面负优化，把我不想看到的都删除了

用法，上传一段示例语音，例如猪八戒的
打上一段文字，例如唐僧念的那段经文

生成的结果就是，猪八戒的音色念唐僧的经文

可以理解为语音克隆

参考语音只需要15秒的范本即可

已精简界面，已删除不需要的模型
原版功能挺多的，还有什么多人对话那种，例如悟空和八戒对话
这些都删除了
为什么删除？
就连简单的文本生成语音都是玩具级别
还谈什么多人对话？
经测试，有吞字想象，有不连贯想象，有标点符号停顿过短想象（抢读）
等等等等一系列问题，如果想拿去商用，还是算了
只是玩具级别，发出来只是让大伙看看，目前AI到了什么境界

运行界面.jpg