只为小站
首页
域名查询
文件下载
登录
正向最大匹配
分词算法
及KNN文本分类算法python实现_knn中文文本分类算法python,文本自动分词1.给定一个分词词典;2.实现正向最大匹配算法对文本进
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-06-25 09:04:28
15KB
分词算法
KNN文本分类算法
python
文本挖掘
分词算法
等等
文本挖掘是从大量文本数据中抽取隐含的,未知的,可能有用的信息。 文本挖掘的研究意义 电子化的文本数量不断增长
2021-06-23 16:51:03
958KB
文本挖掘
词法分析
1
分词算法
词库,搜狗词库(200W+27W+40W).7z
分词算法
词库,搜狗词库(200W+27W+40W)
2021-06-18 19:09:18
10.54MB
分词算法词库
搜狗词库
1
正向最大匹配
分词算法
及KNN文本分类算法python实现
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-05-13 10:48:42
15KB
KNN
NLP
正向最大匹配分词
文本分类
1
python实现机械分词之逆向最大匹配算法代码示例
主要介绍了python实现机械分词之逆向最大匹配算法代码示例,具有一定借鉴价值,需要的朋友可以参考下。
2021-03-19 17:37:08
153KB
python
分词算法
逆向最大匹配分词算法
正向最大匹配分词算法
1
正向最大匹配中文
分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
2021-02-22 18:05:17
3.55MB
中文分词
最大匹配
正向最大匹配
用c/c++完成一
1
C#开发的Excel数据模糊比对界面化软件(VS下可直接运行)
根据公司某部门项目合同数据处理的需求,我自己写的一个以Excel表为输入数据的界面化软件。主要功能为包括:批量输入N个Excel表的数据并进行数据规范化汇总,然后根据分词结果,用余弦定理进行字段的模糊匹配,相似度阈值可以手动调整,分词库也可以自己优化调整,全过程界面化显示,是个成熟度比较高的小软件。使用模块化开发,fuction.cs 中包含很多对Excel操作的函数,可以给大家借鉴到其他场景使用。
2021-02-06 10:07:07
1.71MB
Excel
模糊匹配
相似度比对
分词算法
1
正向最大匹配中文
分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
2020-01-03 11:24:35
3.63MB
中文分词
最大匹配
1
java 实现的中文
分词算法
(代码)
java 实现的基于FMM BMM算法的,中文
分词算法
(代码)
2019-12-21 21:10:30
3.96MB
FMM
BMM
java
分词
1
CRF
分词算法
这是一个关于CRF的源代码,能直接来用,欢迎广大朋友下载
2019-12-21 20:09:27
354KB
CRF
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
MTALAB NSGA2算法
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
华为OD机试真题.pdf
2019年秋招—华为硬件工程师笔试题目.pdf
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
RNN-LSTM卷积神经网络Matlab实现
STM32F4时钟触发ADC双通道采样DMA传输进行FFT+测频率+采样频率可变+显示波形
ChinaMeteorologicalDataHandler.R
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
java-spring-web-外文文献翻译40篇.zip
多机器人编队及避障仿真算法.zip
芯片验证漫游指南以及源代码.zip
张正友相机标定Opencv实现(完整程序+棋盘图)实例源码
simulink仿真实现光伏发电MPPT+能量管理
最新下载
柏林情感语料库
2019年最新alexa数据 (4月27号100W网站)
现代密码学第四版-杨波-课后答案.docx
ArcGIS 9.3.1 9.3SP1 汉化补丁(覆盖安装目录Bin即可)
通信系统工程第二版pdf版
杜洋C#资料
Oracle9i客户端带exp和imp
HC32xxx J-Flash V3.0.zip
Systemvue系统仿真技术应用讲义
SystemVue使用入门.pdf
其他资源
gtest-1.7.0
华为认证HCIE-RS 3.0誉天面试宝典
新飘流幻境脱机外挂.e
2019_MCM-ICM_美赛原题
ais数据解码
微博情感分析论文7篇
GJB150A-2009军用装备实验室环境试验方法(下)
asp图书管理系统源代码
《泛函分析》完整课件打包
最全的同义词表--可用于词扩展
魔兽世界插件编写教程与资料
Quartusii十字交叉路口三色交通灯设计
河北工业大学密码学实验(des和rsa实验)
文件多功能器。2021.3.1..rar
amon_linux.rar
mfc鼠标点击游戏.rar
计算机网络无线层ppt
网络拓扑图必备图标(含网络、主机、存储、安全等各种设备图标)
数学分析第三版上下册课后答案(陈传璋)
Beginning Progressive Web App Development Creating a Native App 无水印原版pdf
大学物理实验报告答案
ook系统matlab仿真
libsvm 数据格式转换宏命令---FormatDataLibsvm.xls