短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Mover's Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。
2022-06-23 11:19:25 1.18MB 短文本; EMD距离; 词向量; 相似度计算;
1
腾讯滑动识别 输入图像返回滑动距离 介绍连接:
2022-06-22 21:06:13 200.33MB 深度学习
车间安全标识距离标准.pptx,这是一份不错的文件
2022-06-22 16:02:58 4.37MB 文档
我国二氧化碳的边际减排成本与区域差异:基于方向距离函数的研究,陈德湖,潘英超,测算二氧化碳的边际减排成本有利于评估区域碳减排潜力与成本,也是落实区域碳交易政策的重要依据。本文采用二次型方向距离函数,
2022-06-21 23:35:51 657KB 首发论文
1
最小编辑距离,字符串相似度,即将一个字符串转换成另一个字符串所需要的最少编辑次数(编辑包括添加,删除,替换三种)
2022-06-21 16:05:31 721B 最小编辑距离
1
这个量衡量了当第 i 个观测值被删除时整个回归函数的变化程度。 应该与 F_p,np 相当:如果 D_i 的“p 值”是 50% 或更多,那么第 i 个点可能有影响:进一步研究这一点。 库克距离 (D_i) 是基于回归参数估计值 b 与移除第 i 个数据点 b_-1 后它们变成的值之间的差异的影响度量。 通常的标准是,如果 D_i 超过 F_p,np 分布的中值,则某个点有影响,其中 p 是回归系数(包括截距)的数量,n 是数据的数量。 输入: D - 矩阵数据 (=[XY])(最后一列必须是 Y 相关变量)。 (X 独立变量条目可以是简单的 [X]、多个 [X1,X2,X3,...Xp] 或多项式 [X,X^2,X^3,...,X^p] 回归模型)。 输出: 库克影响力指数的完整摘要(表格和/或图表)。 对于图形,可以用鼠标将十字准线定位在选定位置。 注意。-人们应该小心。 此
2022-06-21 12:40:56 4KB matlab
1
Android手机光线与距离传感器系统设计与实现.pdf
2022-06-21 09:08:24 1.7MB Android手机光线与距离传感
主要介绍了Android编程基于距离传感器控制手机屏幕熄灭的方法,结合具体实例形式分析了Android距离传感器的控制屏幕熄灭的实现方法与相关操作技巧,需要的朋友可以参考下
2022-06-20 11:16:04 54KB Android 距离传感器 控制 手机屏幕
1
针对传统骨架提取算法结果无法保证骨架单像素性,并且伴有毛刺产生的现象,提出了一种能够有效去除骨架中毛刺分枝,充分体现物体形态特征的骨架剪枝算法。该算法以模糊距离变换为理论基础,在物体粗骨架图像中计算每条尾枝的模糊距离变换值,使用根据骨架特点确定的动态阈值判断骨架分枝是否被去除,并利用分级剪枝方法实现骨架剪枝操作。实验结果表明,该算法在进行剪枝操作中可有效地保证骨架的准确性和连续性。
2022-06-19 16:46:05 310KB 工程技术 论文
1
测角精度和测距精度可设置,单一附合导线条件平差。根据条件平差原理,求算v。
2022-06-19 11:04:06 78KB 条件平差 vba程序开发
1