F5-TTS-main,根据参考语音生成语音,懒人包

F5-TTS-main,根据参考语音生成语音,懒人包

傻木
2024-10-24 / 0 评论 / 41 阅读 / 正在检测是否收录...

F5-TTS-main,根据参考语音生成语音

整合包制作:数字生命卡兹克

我不认识他,整合包来自群友分享,在此基础做了界面负优化,把我不想看到的都删除了

用法,上传一段示例语音,例如猪八戒的
打上一段文字,例如唐僧念的那段经文

生成的结果就是,猪八戒的音色念唐僧的经文

可以理解为语音克隆

参考语音只需要15秒的范本即可

已精简界面,已删除不需要的模型
原版功能挺多的,还有什么多人对话那种,例如悟空和八戒对话
这些都删除了
为什么删除?
就连简单的文本生成语音都是玩具级别
还谈什么多人对话?
经测试,有吞字想象,有不连贯想象,有标点符号停顿过短想象(抢读)
等等等等一系列问题,如果想拿去商用,还是算了
只是玩具级别,发出来只是让大伙看看,目前AI到了什么境界

运行界面.jpg

资源占用.jpg

精简后的压缩包4.3gb,原版大小11gb

下载链接
https://pan.baidu.com/s/11HKrYtgsrArF8kbTP1Vh1g?pwd=gpcb

0

评论 (0)

取消
网站版权本人所有,你要有本事,盗版不究。 sam@gpcb.net