MockingBird “出现注意力模型”是什么意思?指图像出现线条吗?

xj3cbfub  于 2022-11-05  发布在  其他
关注(0)|答案(7)|浏览(175)

我自己准备的数据量大概1GB,步长调到96跑了一天,现在15k了,Loss在几个小时之后就降到0.2之下了,现在是0.12
出现的所有图谱都只是在最顶端有一条紧贴顶边的彩色,除此之外连个线头都没有OTZ
是步长设置的太大了吗?

如何接着别人的模型用自己的数据进行训练?
是在预处理阶段把pretrained.pt换成作者提供的pretrained-11-7-21_75k.pt,还是在训练合成器开始之后生成的MockingBird\synthesizer\saved_models\run_id\run_id.pt中,把这个.pt文件换成pretrained-11-7-21_75k.pt之后继续训练合成器?

7dl7o3gd

7dl7o3gd1#

我自己准备的数据量大概1GB,步长调到96跑了一天,现在15k了,Loss在几个小时之后就降到0.2之下了,现在是0.12 出现的所有图谱都只是在最顶端有一条紧贴顶边的彩色,除此之外连个线头都没有OTZ 是步长设置的太大了吗?

如何接着别人的模型用自己的数据进行训练? 是在预处理阶段把pretrained.pt换成作者提供的pretrained-11-7-21_75k.pt,还是在训练合成器开始之后生成的MockingBird\synthesizer\saved_models\run_id\run_id.pt中,把这个.pt文件换成pretrained-11-7-21_75k.pt之后继续训练合成器?

不是步长问题,而是从头训练的话对数据集的要求会高一点(一般是上百个小时的语音)
回答第二个问题,你这个方法ok的,程序就是根据run id来找对应的文件,文件名改好就好。

flmtquvp

flmtquvp2#

好的,想问一下您现在最好的模型是哪个?还是pretrained-11-7-21_75k.pt吗?最近会继续放出其他模型吗?

2fjabf4q

2fjabf4q3#

好的,想问一下您现在最好的模型是哪个?还是pretrained-11-7-21_75k.pt吗?最近会继续放出其他模型吗?

如果你是finetune训练的话,最好暂时应该是一个多数据集混合训练的25k。近期不会放新模型,可以关注issue网友

rbpvctlc

rbpvctlc4#

不是,是我自己从视频里剪辑的,质量和数量都不太行,预处理之后只有一半能用OTZ…

------------------ 原始邮件 ------------------ 发件人:***@***.***>; 发送时间: 2022年3月1日(星期二) 下午4:54 收件人:***@***.***>; 抄送:***@***.***>;***@***.***>; 主题: Re: [babysor/MockingBird] “出现注意力模型”是什么意思?指图像出现线条吗? (Issue #399) 题主你好,我想请教一下你自己准备的1GB数据集是从那三个指定的中文数据集中分割出来的吗?是否方便给我一份你的1GB数据集?谢谢! — Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android. You are receiving this because you authored the thread.Message ID:***@***.***>

wkftcu5l

wkftcu5l5#

这个pretrained-11-7-21_75k.pt直接用,也有很强烈的电音。
我在它的基础上怎么训练,都消不掉电音。
不知有没有更清楚一点的模型

jyztefdp

jyztefdp6#

好的,想问一下您现在最好的模型是哪个?还是pretrained-11-7-21_75k.pt吗?最近会继续放出其他模型吗?

如果你是finetune训练的话,最好暂时应该是一个多数据集混合训练的25k。近期不会放新模型,可以关注issue网友

是readme里第二个需要切换到tag0.0.1的那个25k模型吗?

wljmcqd8

wljmcqd87#

这个pretrained-11-7-21_75k.pt直接用,也有很强烈的电音。
我在它的基础上怎么训练,都消不掉电音。
不知有没有更清楚一点的模型

我也是,朋友最近解决了这个问题么?按照视频走了一遍,但是效果和视频里的差距挺明显

相关问题