上传者: 42125826
|
上传时间: 2021-12-28 16:41:59
|
文件大小: 18KB
|
文件类型: -
机电一体化
MapReduce 的余弦相似度
描述
该存储库说明了 CSMR 算法的实现。 说明 CSMR 算法的论文已在 2014 年人工智能应用和创新 (AIAI 2014) 会议上发表,标题为“CSMR: A Scalable Algorithm for Text Clustering with Cosine Similarity and MapReduce”。
纸
链接: :
指示
安装 Mahout 0.9 版本和 Hadoop 1.2.1 稳定版
进入 CSMR 目录: cd Cosine-Similarity-with-MapReduce
构建 CSMR: mvn install
在 Cosine-Similarity-with-MapReduce/bin 中添加带有原始格式文档的输入文件夹(将其命名为“输入”)
运行 CSMR: ./run-csmr.sh
查看