上传者: 42149145
|
上传时间: 2021-10-26 23:05:23
|
文件大小: 196.28MB
|
文件类型: -
噪声标签生成和重新标记
在给定噪声率的情况下为数据集生成噪声标签,并使用重新标记算法对这些噪声标签进行重新标记
f1.test.py为all_tickets.csv数据集生成嘈杂的标签,使用“ body”作为特征,使用“ urgency”和“ ticket_type”作为预测标签。 我们假设'紧急'标签可能有一些嘈杂的标签,所以我们在'紧急'上添加了噪音。我们将48000数据拆分为火车数据集,将左侧的数据拆分为测试数据。在为'紧急'生成嘈杂标签's'之后,我们将' body。,'ticket_type'和's'到train_data.csv。在category.py中,我们生成重新标记的标签'relabel'并将其写入relabel.csv文件。除了门票数据集之外,我们还测试了其他数据集。
资料集
文件
结果文件夹
all_tickets.csv
test.py
票
情绪训练
tes