监督学习中的损失函数常用来评估样本的真实值和模型预测值之间的不一致程度,一般用于模型的参数估计。受应用场景、数据集和待求解问题等因素的制约,现有监督学习算法使用的损失函数的种类和数量较多,而且每个损失函数都有各自的特征,因此从众多损失函数中选择适合求解问题最优模型的损失函数是相当困难的。研究了监督学习算法中常用损失函数的标准形式、基本思想、优缺点、主要应用以及对应的演化形式,探索了它们适用的应用场景和可能的优化策略。本研究不仅有助于提升模型预测的精确度,而且也为构建新的损失函数或改进现有损失函数的应用研究提供了一个新的思路。
2022-11-03 10:24:25 1.37MB 监督学习 损失函数 相似度度量
1
此函数使用 Jaccard 系数 (JC) 计算两个图像之间的相似性度量。
2022-11-01 22:34:16 1KB matlab
1
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法。根据最优值得到结构相似度值,进而可以查找出结构相似程序对。最后探讨了程序代码相似度的实际应用。
2022-05-31 14:55:15 276KB 自然科学 论文
1
字符串相似度度量中LCS和GST算法比较.doc
2022-05-11 09:07:57 1.31MB 算法 文档资料
本人的数据结构实习作业“基于Hash表的代码相似度度量”,代码简洁明了,可读性强,并附带较多的注释,方便他人查看。一般通过查看注释便能了解程序的结构与功能,方便进行修改。以下是实习作业的具体要求: 对于两个C++程序,设计并实现两种不同的基于Hash表的检测算法(开地址法和链地址法),计算两个程序的相似度,并分析比较两种算法的效率。 分别读取两个C++程序文件(p1.cpp, p2.cpp),自行设计哈希函数,分别利用开放地址法和链地址法的冲突解决方案,构建C++语言关键字的Hash表。在扫描源程序的过程中,每遇到关键字就查找相应Hash表,并累加相应关键字出现的频度。 根据统计的两个程序中关键字不同频度,可以得到两个向量X1,X2。通过计算向量X1和X2的相对距离来判断两个源程序的相似性,相对距离s的计算方法是( T表示向量的转置) |X1—X2| ((X1—X2)(X1—X2)T)1/2 s= ———————— = ——————————————— |X1|1/2•|X2|1/2 (X1•X1T)1/2(X2•X2T)1/2 利用开放地址法和链地址法两种不同的冲突解决方案构建,分别输出s和两种方法计算s所用的时间。 读取C++程序时,过滤注释,不考虑注释中的内容。(两种注释//和/*…*/) 采用二叉排序树来统计其中的关键字及其频度,按照上述公式计算s,同时给出计算s所用的时间。
2021-12-06 23:44:41 19KB Hash 开地址 链地址 相似度
1
SAM相似度方法,是一种主要用于计算光剖的相似度方法,在很多文献中都有提到,这的光谱指的是 拉曼光谱
2021-10-13 14:39:15 3KB Sa
1
博客https://blog.csdn.net/l5678go/article/details/80383113中提到的数据以及代码 涉及到内容CIR模型,Vasicek模型,最小二乘法拟合,动态时间规整(dynamic time warping,DTW),RCR
2021-05-13 23:45:39 71KB Python 时间序列 证券建模
1
提供了3种矩阵相似度的度量方法。python。详见https://mp.csdn.net/mdeditor/79991322
2019-12-21 20:47:01 4KB 矩阵相似度
1
一些数据挖掘中常用的距离公式和相似度算法,及其python实现代码
2019-12-21 20:17:42 1.82MB 相似度 python
1