有一批100*10000的数据,数据集存储在txt文本中,每行存100个,共有10000条;对每行数据分别进行了5%的梯度替换,得到了从5%~70%的替换文件,现在想用模型训练原始数据,学习原始数据的特征来对不同替换率的文本进行分类,看看不同的替换率下,模型的分类准确率为多少。
压缩包里runrr是主程序,然后数据我放在了data文件夹里,模型是中文的文本分类模型,这个应该把jieba语句注释掉就行了,然后数据集里original是原始数据,每一行代表一条数据,长度为100,共有10000条,sub_num%代表每条数据的替换率,例如sub_5%代表对每条数据进行5%的随机替换。
数据为ATCG的碱基数据,纯碱基数据。
2021-05-21 11:00:09
4.67MB
文本
纯碱基数据
1