只为小站
首页
域名查询
文件下载
登录
NLTK安装包和插件,Python3.4.1版本
自己搜集的NLTK的安装包,里面是Python3.4.1版本,可以安装Python,numpy,NLTK,还附带一些插件,例如
jieba
中文分词,matplotlib绘图,按照步骤安装,自然语言处理的基本功能都可以实现。
2023-11-21 06:08:18
49.83MB
NLTK
Python3.4.1
jieba
自然语言处理
1
jieba
分词详解和实践
jieba
分词是目前最好的 python中文分词组件。在讲解
jieba
分词之前,我们先了解一下中文分词的一些概念: 最常用的TF-IDF 什么是TF-IDF呢?要分成2个部分来理解。 TF,词频——一个词在文章中出现的次数 IDF,在词频的基础上,赋予每个词一个权重,体现该词的重要性。 这是什么意思呢?我们来看个例子。 这是一条财经类新闻 上周 / 沉寂 / 一段 / 时间 / 的 / 白酒股 / 卷土重来 / ;/ 其中 / 古井贡酒 / 的 / 股价 / 创出 / 了 / 历史新高 / , / 这段 / 时间 / …… … 在这篇文章中 上周:出现 1 次 时间:出现 2 次 白酒股:出现
2023-11-15 15:21:07
39KB
jieba
中文分词
1
Python-
jieba
fast使用cpython重写了
jieba
分词库
jieba
_fast 使用cpython重写了
jieba
分词库中计算DAG和HMM中的vitrebi函数,速度得到大幅提升
2023-02-24 14:26:12
19.43MB
Python开发-自然语言处理
1
Python 58同城房价 bs4 浏览器多页爬虫
jieba
中文分词 tf-idf向量化 kmeans聚类
Python 58同城房价bs4 beautiful soup爬虫获取 room_name room_type room_area room_addr0 room_addr1 room_price房价名称类型面积地址价格等
jieba
中文分词 tf-idf向量化 kmeans聚类 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-02-22 22:22:27
113KB
jieba
NLP
爬虫
kmeans
1
jieba
0.42.1中文分词
Python
Jieba
中文分词工具实现分词功能
2023-02-15 18:34:44
53.31MB
python
1
python同义词替换的实现(
jieba
分词)
TihuanWords.txt文档格式 注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。 年休假 年假 年休 究竟 到底 回家场景 我回来了 代码 import
jieba
def replaceSynonymWords(string1): # 1读取同义词表,并生成一个字典。 combine_dict = {} # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割 for line in open(TihuanWords.txt, r, encoding='utf-8'): seperate_word = line.str
2023-01-29 10:29:39
48KB
ie
jieba
python
1
jieba
结巴分词 支持lucene5
jieba
分词器,支持lucene5版本。分词效果非常好,推荐使用。
2023-01-24 17:17:10
10.97MB
结巴
jieba
lucene
analysis
1
jieba
-lucene-analiysis:
jieba
的lucene中文分析器和令牌生成器
捷巴-lucene分析
jieba
使用的lucene中文分析器和Tokenizer( )。
2023-01-24 17:11:16
5KB
tokenizer
analyzer
chinese
lucene
1
使用python进行文本预处理和提取特征的实例
如下所示:
文本过滤
result = re.sub(r'[^\u4e00-\u9fa5,。?!,、;:“ ”‘ '( )《 》〈 〉]', , content)#只保留中文和标点 result = re.sub(r'[^\u4e00-\u9fa5]', ,content)#只保留中文 result = re.sub(r'[^\0-9\.\u4e00-\u9fa5,。?!,、;:“ ”‘ '( )《 》〈 〉]', , content)#只保留中文和标点和数字 r
2022-12-20 13:07:40
40KB
jieba
python
python实例
1
上市公司年报_Python中
jieba
_数字化_关键词词频统计_程序+年报样例
上市公司年报_Python中
jieba
_数字化_关键词词频统计_程序+样例
2022-10-13 18:48:03
245KB
python
词频统计
上市公司年报
数字化
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
voc车辆检测数据集(已处理好,可直接训练)
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
IEEE33节点配电网Simulink模型.rar
DBSCAN算法Matlab实现
PLECS中文手册.pdf
2020年数学建模B题(国二)论文.pdf
vivado 破解 lisence(有效期到2037年) 下载
cublas64_11.dll cublasLt64_11.dll cusolver64_11.dll
token登录器.rar
先进PID控制Matlab仿真第4版-PDF+代码.zip
适用于eNSP 1.3.00 可加载的USG6000V防火墙设备包
Python+OpenCV实现行人检测(含配置说明)
Android小项目——新闻APP(源码)
股票价格预测-LSTM-TCN-GBDT:使用四种算法(LSTM,TCN,GRU,GBDT)进行股票价格的预测和预测结果的检验。有四种算法(LSTM,TCN,GRU,GBDT)用于预测股价并检验预测结果-源码
最新下载
CSI Tool 集成安装包(适配Ubuntu11.04)
1 GJB1269A-2000工艺评审(非密).pdf
SAW温度传感器测温系统中的天线设计
基于声表面波(SAW)的无源无线测温管理系统设计
SAW RFID阅读器的信号处理电路设计
tesseract-ocr安装包和中文语言包.rar
全国村级数据点,最齐全,最准确的资源
GhOst_RAT_beta_v3.6_VIP远控源码带验证.rar
ghost3.6 远控。
ssrs报表开发学习教程
其他资源
SAP-RFC测试工具.zip
MG-SOFT+MIB+Browser+v10b破解版
粒子群优化算法演示及matlab源程序
微电网的调度优化,采用智能算法进行求解
LVDS接口标准(超详细,有图解)
modis数据全球分幅格网shp文件
2018最新全国行政区划编码 Mysql(省市县3级,2018-06-20 统计局发布)
2021/3/5_micropython.tar.gz
java web +JSP+mySQL 购物车
数据库设计文档生成器
jdk-11.0.10_linux-x64_bin.tar.7z
JIRA的配置.xmind
基于B/S模式下的高校食堂管理系统设计
vb+accss实现图纸管理系统+BOM
Go购网络商城
labelImg 1.7 for windows 标图软件
scidavis 免费安装包
软考 软件设计师 历年真题含答案(2004-2017史上最全)
小甲鱼零基础学习C语言,打包下载!!好资源!!!
Kinect程序开发帮助文档(C++)
VC MFC Joseph Link约瑟夫环出列顺序动画演示 源代码
MVC模式_jsp+javabean+servlet开发“在线考试系统”源代码
Android解决多个Fragment切换时布局重新实例化问题,并保存当前fragment页面,系统回收后还原之前fragment页面,更新版
Elements of Computational Statistics(Springer)