上传者: 38735119
|
上传时间: 2022-07-03 10:15:03
|
文件大小: 523KB
|
文件类型: PDF
现代机器学习技术可用于构建强大的对撞机物理问题的模型。 但是,在许多应用中,由于数据中缺少真实级别的信息,因此在不完善的仿真上对这些模型进行了训练,这冒着仿真学习模型风险的风险。 在本文中,我们介绍了无标签分类的范式(CWoLa),其中训练了分类器以区分类的统计混合,这在对撞机物理学中很常见。 至关重要的是,既不需要单个标签也不需要类别比例,但是我们证明了CWoLa范例中的最佳分类器也是在传统的完全监督情况下所有标签信息均可用的最佳分类器。 在一个分析性玩具示例中证明了这种方法的强大功能之后,我们考虑了对撞机物理的现实基准:使用夸克/胶子混合训练样本区分夸克和胶子引发的射流。 更一般而言,CWoLa可以应用于标签或类别比例未知或模拟不可靠但类别的统计混合可用的任何分类问题。