只为小站
首页
域名查询
文件下载
登录
正向最大匹配
分词算法
及KNN文本分类算法python实现_knn中文文本分类算法python,文本自动分词1.给定一个分词词典;2.实现正向最大匹配算法对文本进
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-06-25 09:04:28
15KB
分词算法
KNN文本分类算法
python
文本挖掘
分词算法
等等
文本挖掘是从大量文本数据中抽取隐含的,未知的,可能有用的信息。 文本挖掘的研究意义 电子化的文本数量不断增长
2021-06-23 16:51:03
958KB
文本挖掘
词法分析
1
分词算法
词库,搜狗词库(200W+27W+40W).7z
分词算法
词库,搜狗词库(200W+27W+40W)
2021-06-18 19:09:18
10.54MB
分词算法词库
搜狗词库
1
正向最大匹配
分词算法
及KNN文本分类算法python实现
这份代码是我们专业的一个实验,内容包含了文本分词和文本分类。分别使用了正向最大匹配算法和KNN算法。分词速度平均153295词/秒,189100字符/秒。文本分类使用tf-idf计算单词权重进行特征选择,我测试时选择前100个特征词,根据k的不同取值,分类的准确度平均为75%。
2021-05-13 10:48:42
15KB
KNN
NLP
正向最大匹配分词
文本分类
1
python实现机械分词之逆向最大匹配算法代码示例
主要介绍了python实现机械分词之逆向最大匹配算法代码示例,具有一定借鉴价值,需要的朋友可以参考下。
2021-03-19 17:37:08
153KB
python
分词算法
逆向最大匹配分词算法
正向最大匹配分词算法
1
正向最大匹配中文
分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
2021-02-22 18:05:17
3.55MB
中文分词
最大匹配
正向最大匹配
用c/c++完成一
1
C#开发的Excel数据模糊比对界面化软件(VS下可直接运行)
根据公司某部门项目合同数据处理的需求,我自己写的一个以Excel表为输入数据的界面化软件。主要功能为包括:批量输入N个Excel表的数据并进行数据规范化汇总,然后根据分词结果,用余弦定理进行字段的模糊匹配,相似度阈值可以手动调整,分词库也可以自己优化调整,全过程界面化显示,是个成熟度比较高的小软件。使用模块化开发,fuction.cs 中包含很多对Excel操作的函数,可以给大家借鉴到其他场景使用。
2021-02-06 10:07:07
1.71MB
Excel
模糊匹配
相似度比对
分词算法
1
正向最大匹配中文
分词算法
中文分词一直都是中文自然语言处理领域的基础研究。目前,网络上流行的很多中文分词软件都可以在付出较少的代价的同时,具备较高的正确率。而且不少中文分词软件支持Lucene扩展。但不管实现如何,目前而言的分词系统绝大多数都是基于中文词典的匹配算法。其中最为常见的是最大匹配算法 (Maximum Matching,以下简称MM算法) 。MM算法有三种:一种正向最大匹配,一种逆向最大匹配和双向匹配。本程序实现了正向最大匹配算法。
2020-01-03 11:24:35
3.63MB
中文分词
最大匹配
1
java 实现的中文
分词算法
(代码)
java 实现的基于FMM BMM算法的,中文
分词算法
(代码)
2019-12-21 21:10:30
3.96MB
FMM
BMM
java
分词
1
CRF
分词算法
这是一个关于CRF的源代码,能直接来用,欢迎广大朋友下载
2019-12-21 20:09:27
354KB
CRF
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
BP_PID控制仿真.rar
基于YOLOV5的车牌定位和识别源码.zip
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
多智能体的编队控制matlab程序(自己编写的,可以运行)
python爬虫数据可视化分析大作业.zip
麻雀搜索算法(SSA)优化bp网络
2020年数学建模国赛C题论文
工程伦理_李正风,丛杭青,王前_北京:清华大学出版社 , 2016.08_P329.pdf
基于matlab的车牌识别系统设计
西门子逻辑控制设计开发_3部10层
SSM外文文献和翻译(毕设论文精品).doc
基于hadoop商品推荐系统课程设计
基于Servlet+jsp+mysql开发javaWeb学生成绩管理系统
全国道路网SHP数据.zip
云视通扫描工具.zip
最新下载
gcc-8.5.0-4.el8_5.x86_64.rpm
群联PS3110搜集到的所有固件及升级工具打包
DXFlib来读取DXF文件
NI OPCServer
群联Phison PS3110-S10固态硬盘修复工具.rar
【SHP文件-2022.07】甘肃省行政区划(省、市、县)+道路网+公路网
XZ_excavatorProject.zip
Qt5.9 C++开发指南.pdf 及示例源码
ST7796_stm32_lcd.rar
Discrete_Time_Signal_Processing_2nd_Ed_-_Solutions_to_Exercises
其他资源
《Fundamentals of Statistical Signal Processing,Volume I & II》中文版
电商移动端源码
jsp学生教师信息管理系统
学生成绩管理系统(JSP,JAVA,SQL SERVER)
HTML+CSS网页设计与布局从入门到精通(PDF+源码)
企业财务报表EXCEL电子版带公式
ARM.CMSIS-FreeRTOS.10.0.1
集成固体微波电路-射频设计基础
Fast ICA matlab源代码
openGL做的小球三维碰撞检测程序
OPC Foundation的一些头文件等,32位,64位
MXFInspector.rar
sip代码解释.xlsx
GDAL-3.0.2-cp36-cp36m-win_amd64.whl
spring-tool-suite-4-4.1.0.RELEASE-e4.10.0-win32.win32.x86_64.rar
carbide ui
DS4300更换电池步骤.docx
VMware-Tools-windows-11.0.5-15389592.zip
高校费用微信缴费系统说明
哈尔滨工业大学算法设计与分析讲义
Excel测试用例模板——方便实用
Xilinx可编程逻辑器件应用与系统设计.pdf
网上书店(基于ASP.NET2.0 完整源代码)
linux was 安装
CIF格式
新闻阅读类网站模板
Matplotlib官方文档