BELMKN:贝叶斯极限学习机Kohonen网络 无监督的极限学习机(ELM)是一种用于特征提取的非迭代算法。 该方法应用于IRIS数据集以进行非线性特征提取,聚类预测,最后使用k-means进行聚类。 客观的 要使用Unsuoervised Extreme Learning Machine执行非线性特征学习,使用贝叶斯信息准则(BIC)预测数据集中的聚类数,最后使用k-means,自组织图/ Kohonen网络和EM算法进行聚类 模组 无监督的极限学习机:在此模块中,使用无监督的极限学习机执行数据集的特征提取。 这是具有单个隐藏层的非迭代算法,其中输入层和隐藏层之间的权重被随机初始化,并且使用目标函数计算隐藏层和输出层之间的权重。 因此,可以保证收敛于全局最小值。 贝叶斯信息准则:贝叶斯信息准则是一种统计方法,使用d来找出数据集中的聚类数。 它使用期望最大化(EM)算法来查找数据集中的
1
无监督多跳质量检查 该存储库包含该论文的代码和模型: 。 我们提出了MQA-QG,这是一种无监督的问答框架,可以从同构和异构数据源生成类似于人的多跳训练对。 我们发现我们可以仅使用生成的数据来训练胜任的多跳质量检查模型。 在和数据集中,无监督模型和完全监督模型之间的F1差距小于20。 使用我们生成的数据对多跳质量检查模型进行预训练将大大减少对多步质量检查的人工注释训练数据的需求。 介绍 该模型首先定义了一组基本运算符,以从每个输入源检索/生成相关信息或汇总不同的信息,如下所示。 然后,我们定义六个推理图。 每个都对应一种类型的多跳问题,并被公式化为基于运算符的计算图。 我们通过执行推理图来生成多跳问答对。 要求 的Python 3.7.3 火炬1.7.1 tqdm 4.49.0 变压器4.3.3 资料准备 a)HotpotQA 首先,下载hotpotQA的原始数据集。 H
2022-06-16 20:43:53 1.42MB Python
1
DataScience:机器学习中特征工程之WOE编码(离散变量编码/有监督)的简介、计算过程、案例应用之详细攻略 (1)、什么是WOE编码 (2)、案例理解WOE编码 (3)、WOE编码技术的深度思考 (4)、为什么选择采用WOE编码? (5)、WOE编码的优势 WOE编码—离散变量编码(有监督性的编码) 在建模前,我们需要把原始的值转化成WOE值才能使得模型效果好。 提出问题 怎样对字段的每个分段进行评分呢?这个评分是怎么来的? 解决方案 WOE编码, 将预测概率值转化为评分, 利用变量相关性分析和变量的系数符号保证每个分箱评分的合理性。 分箱之后我们便得到了一系列的离散变量,下面需要对变量进行编码,将离散变量转化为连续变量。WOE编码是评分卡模型常用的编码方式。
2022-06-16 14:05:38 508KB 机器学习 WOE编码精讲
肺炎疫情防控监督检查情况报告20203篇.pdf
2022-06-15 19:02:33 27KB
ENVI监督分类、决策树分类、火烧迹地提取和ArcMap制图,适用于遥感软件初学者大学生
2022-06-14 19:05:42 7.53MB ENVI 遥感数据处理
1
半监督文本分类的变体自动编码器 所有这些存储库都在标题为“用于半监督文本分类的可变自动编码器”的论文中使用。 列表: data:所有数据文件都保存在此目录中,包括数据,单词嵌入,pretrained_weights。 结果:保存结果模型的目录。 assistant_vae和avae_fixed:在VAE中使用辅助变量的模型,可以产生良好的结果。 它们的不同之处在于是否在生成中固定潜在变量。 SemiSample-S1是带有基于EMA基准的基于采样的优化器的模型 SemiSample-S2是带有VIMCO基线的基于采样的优化器的模型 笔记 该代码有点多余,因为最初的模型是使用辅助变量提出的,但是事实证明,如果没有辅助变量,它也可以很好地工作。 要运行此代码,您可能需要预处理的数据,可以通过给我发送电子邮件(pku.edu.cn上的wead_hsu)获得这些数据。 或者,您也可以使用
2022-06-09 15:45:56 485KB Python
1
支持向量机_with_python 在本笔记本中,我们介绍了支持向量机(SVM)算法,这是一种功能强大但简单的监督学习方法,用于预测数据。 对于分类任务,SVM算法尝试将特征空间中的数据划分为不同的类别。 默认情况下,这种划分是通过构造最佳分割数据的超平面来执行的。 为了进行回归,构造了超平面以映射数据分布。 在这两种情况下,这些超平面均以非概率方式映射线性结构。 但是,通过采用内核技巧,我们可以将非线性数据集转换为线性数据集,从而使SVM可以应用于非线性问题。 SVM是功能强大的算法,已得到广泛普及。 这部分是由于它们在高维特征空间中有效,包括那些特征数与实例数相似或略微超过实例数的问题。 与具有大量数据集的内存需求很高的KNN不同,SVM可以提高内存效率,因为仅需要支持向量即可计算超平面。 最后,通过使用不同的内核,SVM可以应用于各种学习任务。 另一方面,这些模型是黑匣子,很难解释
2022-06-06 21:07:08 84KB JupyterNotebook
1
建设工程质量监督信息化的应用.pdf
2022-06-04 22:01:23 668KB 文档资料 资料
高达模板支撑系统安全监督导则.pdf
2022-06-03 19:00:48 832KB 系统安全 安全 资料
基于半监督的图卷机异常识别DGCN(DGL)项目代码
2022-06-03 17:05:11 149.18MB 源码软件
1