火花余弦相似度
这是一个脚本,输入一个矩阵并计算矩阵中每个向量与其他向量的余弦相似度
例子:
*add test dataset (dataset.txt) into hadoop hdfs
这是数据集的摘录:
"16",45,12,7,2,2,2,2,4,7,7
"28",1,1,1,0,0,0,0,0,0,0
"35",28,9,6,1,0,3,0,5,2,2
"52",28,7,3,3,3,1,2,4,4,3
"63",17,5,1,0,0,0,0,4,1,1
"67",35,20,10,1,1,8,0,17,8,4
2021-09-14 10:45:21
27KB
Python
1