简介-自然语言处理 汉良作者何晗老师的新书《自然语言处理入门》详细的笔记!业界良心之作,书中不是枯燥无味的公式罗列,甚至用白话分解的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词,词性标注,命名实体识别,信息删除,文本聚类,文本分类,句法分析这几个热门问题的算法原理与工程实现。 本项目初步帮助更多同路人能够快速的掌握NLP的专业知识,理清知识要点,在工作中发挥作用的作用。以书本为主,记录本人学习此书的心路历程,总结和笔记。 机器学习与深度学习请转至本人项目: HanLP项目: 思维导图,请关注AIArea公众号并回复:NLP思维导图,即能下载高清大图。 目录 章节
2021-12-06 11:58:27 6.96MB nlp ai deep-learning mechine-learing
1
用户兴趣模型是个性化推荐技术的基础与核心,针对现有用户兴趣模型在模型建立阶段用户兴趣评价的不足,提出了一种基于混合行为评价兴趣度值的方法。突出了用户阅读时间的特殊性,在用户阅读时间异常的情况下利用其他浏览行为来量化用户兴趣度,并结合用户的浏览内容提出了用户兴趣模型的表示和更新机制,从而建立用户兴趣模型。实验验证了兴趣度度量方法的有效性,将测试结果与K-means聚类模型进行比较,证明该模型的推荐准确度有明显提高。
1
文本聚类中的DBSCAN算法的实现,感谢指教
2021-11-08 20:28:00 17KB DBSCAN 文本聚类
1
文本聚类 文本聚类的一种实现,使用 k-means 进行聚类,并使用作为距离度量。 等等,什么? 基本上,如果您有一堆文本文档,并且您想按相似性将它们分成 n 个组,那么您很幸运。 例子 为了测试这一点,我们可以查看test_clustering.py : from vectorizer import cluster_paragraphs from random import shuffle text1 = """Type theory is closely related to (and in some cases overlaps with) type systems, which are a programming language feature used to reduce bugs. The types of type theory were created to avo
2021-11-08 17:54:02 9KB Python
1
对文本进行聚类,文本预处理-->构造特征向量-->聚类,压缩包内含有实验用语料亲测可用, 谢谢支持。
2021-10-12 15:33:25 685KB 5.1
1
用C#实现的k均值文本聚类算法,已经调试通过
2021-08-26 18:31:14 37KB k均值 k-means 文本聚类 分类
1
一种基于Small-World和相似度的文本聚类算法.pdf
2021-08-21 13:03:47 332KB 聚类 算法 数据结构 参考文献
四维文档向量模型的k-means新闻文本聚类算法.pdf
2021-08-21 09:37:23 280KB 聚类 算法 数据结构 参考文献
概念向量文本聚类算法.pdf
2021-08-20 14:13:46 370KB 聚类 算法 数据结构 参考文献
基于文本聚类的工具书查重方法研究.pdf
2021-08-20 14:13:40 340KB 聚类 算法 数据结构 参考文献