kNN(k-nearest neighbors algorithm) 此专案以新闻分类进行kNN范例之实作 kNN Introduction: 最近鄰居法(KNN演算法,又譯K-近鄰演算法)是一種用於分類和回歸的無母數統計方法,KNN常用來做資料分類。 KNN是一種監督式學習(Supervised Learning),監督式學習需透過資料訓練出一個model,但KNN沒有做training的動作。 K為使用者自己定義的常數,KNN就是選擇離自己最近的K的鄰居(Data),之後觀察哪一種類別(Tag)的鄰居最多就將自己也當成該類別。 Input: 测试文章: 1.使用ETtoday新聞作為訓練集分類。 2.使用Jieba作為分詞,取出Top 100 Words 作為每篇文章的關鍵詞。 3.取出k=3個最近鄰居作為分類依據,此外對最近的第一個鄰居作為加權*2 Output:
2022-03-04 15:56:12 605KB news tf-idf cosine-similarity knn
1
机电一体化 MapReduce 的余弦相似度 描述 该存储库说明了 CSMR 算法的实现。 说明 CSMR 算法的论文已在 2014 年人工智能应用和创新 (AIAI 2014) 会议上发表,标题为“CSMR: A Scalable Algorithm for Text Clustering with Cosine Similarity and MapReduce”。 纸 链接: : 指示 安装 Mahout 0.9 版本和 Hadoop 1.2.1 稳定版 进入 CSMR 目录: cd Cosine-Similarity-with-MapReduce 构建 CSMR: mvn install 在 Cosine-Similarity-with-MapReduce/bin 中添加带有原始格式文档的输入文件夹(将其命名为“输入”) 运行 CSMR: ./run-csmr.sh 查看
2021-12-28 16:41:59 18KB Java
1
Img2VecCosSim-Django-Pytorch 提取任何图像的特征向量,并找到余弦相似度以使用Pytorch进行比较。 我已经使用ResNet-18提取图像的特征向量。 最后,开发了一个Django应用程序来输入两个图像并找到余弦相似度。 包装方式: 火炬 Django 2.0 学分: 灵感来自 如何开始: 克隆存储库 git clone https://github.com/MexsonFernandes/Img2VecCosSim-Django-Pytorch 变更目录 cd Img2VecCosSim-Django-Pytorch 安装虚拟环境 pipenv install 安装所有依赖项 pipenv install -r requirements.txt或pip install -r requirements.txt 启动Django服务器 python
2021-11-05 19:59:29 4.55MB python django pytorch cosine-similarity
1