上传者: 42099116
|
上传时间: 2021-09-14 10:45:21
|
文件大小: 27KB
|
文件类型: ZIP
火花余弦相似度
这是一个脚本,输入一个矩阵并计算矩阵中每个向量与其他向量的余弦相似度
例子:
*add test dataset (dataset.txt) into hadoop hdfs
这是数据集的摘录:
"16",45,12,7,2,2,2,2,4,7,7
"28",1,1,1,0,0,0,0,0,0,0
"35",28,9,6,1,0,3,0,5,2,2
"52",28,7,3,3,3,1,2,4,4,3
"63",17,5,1,0,0,0,0,4,1,1
"67",35,20,10,1,1,8,0,17,8,4