只为小站
首页
域名查询
文件下载
登录
(可用作科研)中文分词、去停用词 python代码
把需要分词去停用词的文件放入allData文件夹下的originalData文件夹,依次运行1.cutWord.py和2removeStopWord.py之后,allData文件夹下的afterRemoveStopWordData文件夹就是最终分词且去停用词之后的文件
2022-02-14 16:04:23
9.28MB
python
中文分词
开发语言
后端
1
ZH_Stopwords.zip
对于NLP中,需要要一些停用字典来对一些没有用的词删除,这里列了一些停用词。 包含: 1、哈工大停用词表, 百度停用词表, 四川大学机器智能实验室停用词库,而且将其进行了合并去重, 共计2311个停用词; 2、3500个常用汉字, 5000+生僻字集合; 3、一般常用停用此表1800多个。
2022-02-11 18:32:36
47KB
NLP
中文停用词
整合多个停用此表
1
停用词 再生成词云的时候可以使用到
停用词 再生成词云的时候可以使用到
2022-02-09 09:11:34
13KB
停用词
1
已整理 停用词表 符号、英文、中文应删除词集合
压缩包里含四个文本文档 1、符号stopWord.txt (1KB) 2、英文stopWord.txt (3KB) 3、中文stopWord.txt (8KB) 4、集合stopWord.txt (11KB) 其中第四个文档是前三个文档的集合。 此是本人实验过程中搜集整理的结果(以前的老版本加上自己整合的)。 已做预处理等,保证不重复。
2022-02-06 22:53:59
11KB
NLP
应删除词
stopwords
停用词表
1
python 文本分析停用词词库,情感识别语义分析去除停用词必不可少步骤语料
哈工大停用词表 川大智能实验室停用词表 中文停用词词表
2022-02-06 14:11:22
9KB
python
自然语言处理
开发语言
后端
1
TF-IDF算法常用停用词表
在使用TF-IDF算法进行自然语言处理时,大家在处理文本时会首先进行切割,生成包含所有词的词典,但此时往往会有许多重复的词,这些词可能是经常使用的词,比如”的“,这样的词语太多会影响处理效果,因此需要去掉这些停用词在进行处理,在此提供停用词表!
2022-01-30 17:40:38
21KB
TF-IDF
停用词
1
易语言安卓手机+系统自带APP+卸载与停用+免ROOT+修订版工具源码
修复之前一个错误 需要开启调试模式 要安装 Android Composite ADB Interface 驱动
2022-01-28 14:04:56
969KB
易语言安卓手机+系统自带APP+
C#设备管理器(源码)
无介绍不输入不行吗?
2022-01-28 14:00:56
104KB
API
C#
启用停用设备
设备管理器
1
NLPIR分词、去停用词
整合 使用ICTCLAS2013(NlPIR) x64 的中文分词,分词的速度和效果都不错。然后就是对文本进行的去停用词以及特殊符号(哈工大停用词库)的去除,这些特殊符号还有标点符号,以及文本中夹杂的数字和字母会对分词的效果产生影响。eclipse GBK 编码
2022-01-21 17:55:12
5.53MB
NLPIR
分词
过滤停用词
1
es5.3.2使用热词、停用词、同义词词典.rar
es5.3.2热词、停用词、同义词词典,包括插件压缩包,插件源码,远程词典服务端示例,配置说明等
2022-01-20 14:01:16
8.32MB
es热词
es同义词
es远程词典
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
2020年数学建模国赛C题论文
中国地面气象站观测数据2000-2021
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
Plex v7.12电视端app
大学生网页设计大作业-5个网页设计制作作品自己任选
avantage 软件 xps 处理软件30天后不能使用问题
基于傅里叶算子的手势识别的完整源代码(Python实现,包含样本库)
sqlite运行所需Vc++运行环境,纯净版System.Data.SQLite.dll及SQLite.Interop.dll
智能微电网中利用粒子群算法实现多目标优化(有完整数据可运行).zip
RX560 bios合集(请务必注意显存品牌和大小以及是否需要6pin!)含刷新工具.zip
YOLOv5 人脸口罩图片数据集
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
Keil5安装包
cplex_studio129.win-x86-64.exe CPLEX 12.9直接安装可使用
最新下载
U8开发之EAI接口.docx
安卓导航HW8227系统固件+MCU+升级教程
UG NX for China 使用手册
基于STM32F401的智能门锁项目
电子文件签字+合同系统实现Java源码 (SpringBoot+thymeleaf)
101-102-103-104-CDT-1801规约文本
E9-人力资源模块API说明.docx
神经网络蚁群算法(带源码)
MIPS数字标牌信息发布系统_标准版本_FREE V4.0.0.zip
三维DWA动态避障(matlab代码可直接运行,且有详细注释,适合算法入门移植)
其他资源
东北大学软件学院面向对象程序实验设计实验代码(全)
Springboot+Poi实现Excel的导入导出
软件系统测试报告模板
陈启宗 《线性系统理论与设计》
RLS和LMS算法分析比较
基于安卓课堂签到签到系统,教师端+学生端,源代码-服务端-数据库
小区物业管理系统 (含 数据库)
sqlserver 课程设计 BLOG.系统源程序和mdf,ldf文件
AM335X及DDR3原理图和PCB图完整设计
prius 电机ansoft仿真
python距离测量的方法
NT3969A_V1.0_20040211.pdf
Vue-Wookie-源码
一种光电混合集成有源光双稳器件
初级篇:借助LVS+Keepalived实现负载均衡
locipoint-win:Windows的LociPoint-源码
实时巴士小程序带后端_小程序后端
TCP/IP详解卷1:协议原书第2版
二维区域图形裁剪
java语言银行ATM系统界面实现
数据库课程设计----C#版学生信息管理系统
hog+svm行人检测分类器训练
基于ZigBee的多功能有害气体检测软件程序和硬件电路和说明文档
HTML+CSS旅游网