思路: 1.读取所有文章标题; 2.用“结巴分词”的工具包进行文章标题的词语分割; 3.用“sklearn”的工具包计算Tf-idf(词频-逆文档率); 4.得到满足关键词权重阈值的词 结巴分词详见:结巴分词Github sklearn详见:文本特征提取——4.2.3.4 Tf-idf项加权 import os import jieba import sys from sklearn.feature_extraction.text import TfidfVectorizer sys.path.append(../) jieba.load_userdict('userdictTest.t
2022-03-15 16:37:57 72KB jieba python3 tf-idf
1
本文实例讲述了Python3实现的简单工资管理系统。分享给大家供大家参考,具体如下: 工资管理系统要求: 1. 查询员工工资 2. 修改员工工资 3. 增加新员工记录 4. 退出 执行代码: #!/usr/bin/env python3 # Author:Robert # --*-- coding: utf-8 --*-- def file_test(): with open(info.txt,'r',encoding=utf-8) as f: file = list(f) return file def server(): for i in range(1)
2022-03-15 16:33:59 49KB python3 python函数 python实例
1
本文将和大家分享一些从互联网上爬取语料的经验。 0x1 工具准备 工欲善其事必先利其器,爬取语料的根基便是基于python。 我们基于python3进行开发,主要使用以下几个模块:requests、lxml、json。 简单介绍一个各模块的功能 01|requests requests是一个Python第三方库,处理URL资源特别方便。它的官方文档上写着大大口号:HTTP for Humans(为人类使用HTTP而生)。相比python自带的urllib使用体验,笔者认为requests的使用体验比urllib高了一个数量级。 我们简单的比较一下: urllib: import urlli
2022-03-14 12:25:05 223KB html代码 lxml python
1
HTMLTestReportCNPython3.py--python3生成HTML测试报告模板
2022-03-14 11:22:03 25KB HTMLTestRepo unittest报告 python3
1
python-3.7.1-amd64.exe 官网windows最新版,加快下载速度。
2022-03-13 22:05:45 25.04MB python python3.7.1
1
最新版本Python3.6.3 64位 zip解压版 最新版本Python3.6.3 64位 zip解压版 最新版本Python3.6.3 64位 zip解压版
2022-03-13 18:24:47 6.81MB Python3.6.3
1
reference-index 描述了 Python 语言的具体语法和语义,这份库参考则介绍了与 Python 一同发行的标准库。它还描述了通常包含在 Python 发行版中的一些可选组件。
2022-03-13 16:40:59 19.34MB 标准库
1
主要为大家详细介绍了python3射线法判断点是否在多边形内,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
1
3.6新的语法特性: PEP 498, 格式化字符串字面量 PEP 515, 数字字面量中的下划线 PEP 526, 变量注解中的语法 PEP 525, 异步生成器 PEP 520: 异步解析式 新的库模块 secrets: PEP 506 - 在标准库中添加了Secrets模块
2022-03-13 13:19:31 29.15MB Python3.6
1
当你的才华还撑不起你的野心时,你应该静下心去学习 。 前言 已经搭建好代理IP池之后,就可以尝试用获得的代理IP访问给定URL,爬取页面,具体的源码和更多说明在github库Simulate-clicks-on-given-URL里,供大家学习。 代码 这段代码可以返回我们需要的用户IP PROXY_POOL_URL = 'http://localhost:5555/random' def get_proxy(): try: response = requests.get(PROXY_POOL_URL) if response.status_cod
2022-03-12 15:50:18 149KB python python3 爬虫
1