简介-自然语言处理 汉良作者何晗老师的新书《自然语言处理入门》详细的笔记!业界良心之作,书中不是枯燥无味的公式罗列,甚至用白话分解的通俗易懂的算法模型。从基本概念出发,逐步介绍中文分词,词性标注,命名实体识别,信息删除,文本聚类,文本分类,句法分析这几个热门问题的算法原理与工程实现。 本项目初步帮助更多同路人能够快速的掌握NLP的专业知识,理清知识要点,在工作中发挥作用的作用。以书本为主,记录本人学习此书的心路历程,总结和笔记。 机器学习与深度学习请转至本人项目: HanLP项目: 思维导图,请关注AIArea公众号并回复:NLP思维导图,即能下载高清大图。 目录 章节
2021-12-06 11:58:27 6.96MB nlp ai deep-learning mechine-learing
1
matlab 数据集 聚类 经典UCI数据集 moondata
2021-12-06 11:38:19 1KB 聚类 matlab
1
为准确了解我国转型升级的研究热点,及时把握该领域的研究动态,在收集CSSCI期刊中2005年1月—2014年10月有关转型升级论文的基础上,将其关键词进行整理归类,并运用Ucinet 6.216对关键词网络进一步分析。结果显示,目前我国与转型升级相关的研究热点集中于"制造业""中小企业"和"长江三角洲地区"等,围绕这些研究热点,"技术创新""产业集群升级""战略性新兴产业"等起到桥梁作用,是"制造业"等研究热点进行转型升级时的主要路径。这一结果表明,目前,我国作为世界制造业大国,制造业企业成为转型升级初期的重点,并且转型升级的重心逐渐向创新靠拢。做此研究以期为我国转型升级的研究方向提供一定的借鉴,促进我国产业经济的转型升级和创新战略的进一步发展。
2021-12-06 11:12:32 708KB 转型升级 共词网络 社会网络分析
1
本实验利用两类数据:模拟数据与真实数据。模拟数据有著名复杂网络学者Mark Newmann所提出,该网络包括128个节点,每个节点的度为16,网络包含4个社团结构,每个社团包含32个节点,每个节点与社团内部节点有k1个节点相互链接,与社团外部有k2个节点相互链接 (k1+k2=16)。通过调节参数k2 (k2=1,2,3,4,5,6,7,8)增加社团构建检测难度。http://www-personal.umich.edu/~mejn/ 真实数据集:跆拳道俱乐部数据由34个节点组成,由于管理上的分歧,俱乐部分解成两个社团。 包括代码和文档
2021-12-05 20:51:08 569KB 聚类 数据挖掘
1
optics是典型的多维聚类方法,在模式分类和机器学些中都有广泛的应用。
2021-12-05 15:43:30 638KB optics 多维聚类
1
为对全国各地区的安全生产状况有一个清晰直观的认识,了解不同地区安全管理水平的差异性,基于SPSS软件对2009~2016年我国各地区的安全生产统计数据进行系统聚类分析,将我国31个省、市、自治区的安全生产状况划分为4类,通过分析不同类别地区安全生产状况的特点及原因,为控制和预防生产安全事故提供依据。
2021-12-05 15:00:02 232KB 行业研究
1
压缩包内包含源代码,报告和实验数据。本实验采用C均值聚类和分裂聚类对数据 进行聚类,数据集为435个男女身高体重,分析不同的初始聚类中心对结果的影响;分裂聚类与C均值聚类在结果上的差别;聚类指标与聚类别数的关系
2021-12-05 13:48:32 1.05MB C均值 分裂聚类
1
k-means 聚类算法思想先随机选择k个聚类中心,把集合里的元素与最近的聚类中心聚为一类,得到一次聚类,再把每一个类的均值作为新的聚类中心重新聚类,迭代n次得到最终结果分步解析 一、初始化聚类中心 首先随机选择集合里的一个元素作为第一个聚类中心放入容器,选择距离第一个聚类中心最远的一个元素作为第二个聚类中心放入容器,第三、四、、、N个同理,为了优化可以选择距离开方做为评判标准 二、迭代聚类 依次把集合里的元素与距离最近的聚类中心分为一类,放到对应该聚类中心的新的容器,一次聚类完成后求出新容器里个类的均值,对该类对应的聚类中心进行更新,再次进行聚类操作,迭代n次得到理想的结果 三、可视化展
2021-12-04 22:03:46 41KB k-means mean ns
1
非常常用的聚集行为插件 解压缩导入Package使用 全平台支持 内含示例场景
2021-12-04 18:13:48 1.24MB unity 聚类算法 Unity插件
1