我今天也用阿里 CosyVoice-win复刻一个音频给大家听听。

这是用我自己的声音复刻的,先说说个人感受。个人感觉目前这玩意儿对于各种情绪感情的处理还不是很稳定。有些地方非常的棒,但有些地方咋听咋奇怪。当然也有可能是我不会调其他参数的原因。我也是根据昨天小五分享的那个音频里面的方法来操作的。其次就是我的声音,我这28岁的年龄被他这一整感觉年龄上直接给我减半了,听上去很稚嫩。总的来说,这个效果没达到我的理想状态。其次我也再次声明一下,这玩意儿目前只能在电脑上用,且对电脑的配置段誉神篇要求稍许有点高,最起码独立显卡你得具备。就我发出来这个音频。总共字数3876字。生成音频以后音频总时长14分32秒。我这个4060的8G显存的显卡处理时间用了半小时。且处理过程中风扇高速运转,温度急剧升高,我都生怕温度过高导致机器降频甚至进入高温保护无法开机。并不是我夸张,前两天给一个朋友训练模型就出现了这种状况。毕竟这天气太热了。不幸中的万幸,机器顺利的挺过来了。所以要想玩这个的朋友先看看你的电脑满不满足这个要求。Ok,闲言少续,各位直接听听吧。

发表于:2024-07-27 12:31
5个回复
您还没有登录,登录后才可回复。 登录 注册