针对同类文本中提取的关键词形式多样,且在相似性与相关性上具有模糊关系,提出一种对词语进行分层聚类的文本特征提取方法。该方法在考虑文本间相同词贡献文本相似度的前提下,结合词语相似性与相关性作为语义距离,并根据该语义距离的不同,引入分层聚类并赋予不同聚类权值的方法,最终得到以词和簇共同作为特征单元的带有聚类权值的向量空间模型。引入了word2vec训练词向量得到文本相似度,并根据Skip-Gram+Huffman softmax模型的算法特点,运用点互信息公式准确获取词语间的相关度。通过文本的分类实验表明,所提出的方法较目前常用的仅使用相似度单层聚类后再统计的方法,能更有效地提高文本特征提取的准确性。
2021-04-30 17:02:54 1.21MB 语义 文本特征 分层聚类
1
面向背景的分层液体病例研究 背景导向纹影 来自维基百科的免费百科全书背景导向纹影(BOS)是一种利用流体密度和折射率之间的Gladstone-Dale关系对流体密度梯度进行流动可视化的新技术。 BOS通过消除使用昂贵的镜子,激光和刀刃的需要简化了可视化过程。在其最简单的形式中,BOS利用随机生成的点阵图形的简单背景图案,廉价的频闪光源和高速数码相机。 在其实施的初始阶段,它主要用作定性可视化方法。进一步研究开发该技术将实现流体流动的定量可视化,包括低温流动,超音速和高超声速流动,生物医学装置流动可视化等各种应用。 更多信息,请访问https://en.wikipedia.org/wiki/Background-oriented_schlieren_technique 该软件主要由来自特拉维夫大学Alex Liberzon实验室的Lilly Verso编写,使用OpenPIV软件包作为平台。该软件利用OpenPIV Matlab软件包进行互相关分析(基本上是PIV分析的剥离版本)和OpenPIV - Poisson求解器思想的压力包。使用公共域Matlab代码测试了额外的泊松求解器。感谢这些软件包的作者。
2021-04-27 21:00:05 94.05MB 背景导向纹影 MATLAB
1
分层线性模型HLM5.04版分析软件!分层线性模型HLM5.04版分析软件!分层线性模型HLM5.04版分析软件!
2021-04-23 23:30:26 5.7MB 分层线性模型
1
Arcgis按属性字段分割要素 : 数据分层按字段导出
2021-04-22 21:00:16 42KB arcgis
1
一个非常好的文档来介绍DDD分层架构参考代码目录结构,接口层,应用层,领域层和基础层等!
1
公司年会抽奖软件6.2+可多分层设置中奖名单!很实际的软件,亲测可用。
2021-04-19 10:55:09 9.81MB 公司 年会 抽奖 中奖
1
现有基于时域金字塔的特征提取方法不能学习视频帧和视频段各自之间的时间依赖性信息以及未充分利用视频时域的分层结构信息,造成视频分类特征提取不充分.为此,提出一种基于SRU的多层次多粒度时空域深度特征提取方法.利用卷积神经网络提取视频的低、中、高3个层次的帧特征,构建时域金字塔,同时采用级联SRU学习视频时间依赖性和时域的分层结构特征,通过聚合3个层次的时域金字塔得到视频的多层次多粒度全局特征.在数据集UCF101和HMDB51上的实验结果表明,与DTPP方法、TLE方法相比,该方法提取的特征具有较好的表征能力和鲁棒性.
1
Google 是一个数据驱动型公司,这意味着所有对用户的改动的发布,都要决策者以相 应的经验数据作为依据。这些数据大部分是由在线流量上的实验产生的。在 web 的语境下, 一个实验是由一股流量(比如,用户的请求)和在这股流量上进行的修改组成的。用户可见 的修改(比如,修改顶部广告的背景色),以及不可见的修改,比如测试一个新的广告点击 率(CTR)预测算法,都可以通过实验的方式进行的。 要支持数据驱动方法论的挑战在于要跟上创新的速度。我们想支持进行尽可能多的实验, 如果实验平台要限制同时进行的实验的数量,那是绝不可被接受的。我们进行实验是为了测 试一些新的特性和挖掘一些已有特性的提升空间。对于已有特性,实验可以学习到用户的反 应并可以对特性进行优化。试想一下,如果在搜索结果页上的内容都是通过参数控制的,包 括展示方式和算法。通过对参数设置不同的参数值进行实验,我们可以用衡量指标(用户体 验,收入或其它指标)来决定是否要进行哪些修改以得到最好的结果。
2021-04-16 15:54:32 1.01MB 分层实验
1
UWSN的分层代码分配算法和基于状态的CDMA协议
2021-04-13 15:22:53 896KB 研究论文
1