是小打小闹 哈哈,现在开始正式进行爬虫书写首先,需要分析一下要爬取的网站的结构:作为一名河南的学生,那就看看郑州的二手房信息吧! 在上面这个页面中,我们可以看到一条条的房源信息,从中我们发现了什么,发现了连郑州的二手房都是这么的贵,作为即将毕业的学生狗惹不起啊惹不起 还是正文吧!!!由上可以看到网页一条条的房源信息,点击进去后就会发现: 房源的详细信息。OK!那么我们要干嘛呢,就是把郑州这个地区的二手房房源信息都能拿到手,可以保存到数据库中,用来干嘛呢,作为一个地理人,还是有点用处的,这次就不说了好,正式开始,首先我采用python3.6 中的requests,BeautifulSoup
2021-12-28 23:15:38 686KB python python函数 二手房
1
目录   1、项目背景   2、信息的爬取(基于51job招聘网站的数据爬取)    1)导入相关库    2)关于翻页的说明    3)完整的爬取代码   3、数据预处理    1)相关库的导入及数据的读取    2)热门城市的岗位数量TOP10    3)岗位名字段的处理    4)工资水平字段的处理    5)工作地点字段的处理    6)公司类型字段的处理    7)行业字段的处理    8)经验与学历字段的处理    9)工作描述字段的处理    10)公司规模字段的处理    11)构造新数据   4、关于“工作描述”字段的特殊处理   5、tableau可视化展示    1) 热
2021-12-26 13:03:41 687KB ab ble info
1
是小打小闹 哈哈,现在开始正式进行爬虫书写首先,需要分析一下要爬取的网站的结构:作为一名河南的学生,那就看看郑州的二手房信息吧! 在上面这个页面中,我们可以看到一条条的房源信息,从中我们发现了什么,发现了连郑州的二手房都是这么的贵,作为即将毕业的学生狗惹不起啊惹不起 还是正文吧!!!由上可以看到网页一条条的房源信息,点击进去后就会发现: 房源的详细信息。OK!那么我们要干嘛呢,就是把郑州这个地区的二手房房源信息都能拿到手,可以保存到数据库中,用来干嘛呢,作为一个地理人,还是有点用处的,这次就不说了好,正式开始,首先我采用python3.6 中的requests,BeautifulSoup
2021-12-24 15:44:44 686KB python python函数 二手房
1
词频分析,聚类,文本挖掘,自然语言处理,数据可视化
2021-11-19 15:36:35 29.26MB 社交网站 数据挖掘
1
今天的 Matomo 是一个完整的多合一网络分析平台。网站在线数据网络统计分析平台 Matomo 提供: Matomo 分析界面 100% 数据所有权 – 将您的数据掌握在自己手中 灵活性 可靠性和安全性 一个易于使用的工具 用户隐私保护 自托管本地或云主机的选项 开源分析 GDPR 合规性 100 多个集成 对于我们的用户来说,这意味着: 网络和移动分析 转换优化功能(热图、会话记录、AB 测试、漏斗、表单分析) 访客档案 标签管理器 没有数据限制 无数据采样 白标报告和定制设计的界面 Matomo 的价值观: 开放性 自由 透明度 数据所有权 隐私 Kaizen(改善):持续改进 将这些核心价值与可用的最强大的网络分析和转换优化功能结合起来。这使得各种规模的企业都可以轻松访问它。您所需要的只是这个集中式工具。 完整的分析。100% 你的。 使用 Matomo,企业和个人可以放心,数据 100% 属于您,并且您用户的隐私得到尊重。网站所有者(您)和访问者之间的关系仍然存在,没有外部来源查看。这是因为您可以选择在自己的服务器上自行托管 Matomo,以确保数据保留在您的手中。 从 2007 年的 Piwik 到现在的 2018 年的 Matomo,这是一段令人难以置信的旅程。对于那些从一开始就相信我们的人,我们要向你们表示衷心的感谢!对于未来的支持者,我们很高兴您能加入我们。前面有令人兴奋的项目,我们迫不及待想与大家分享。
双 0.8 中 每个经纪 人 sasl.login.refresh.windo w.jitter 相对于凭证生命周期中添加到登录刷新线程的休眠时间的最大随机抖动 量。合法值介于 0和 0.25(25%)之间;如果未指定值,则使用默认值 0.05 (5%)。目前仅适用于 OAUTHBEARER。 双 0.05 中 每个经纪 人 sasl.mechanism.inter.bro ker.protocol SASL 机制用于代理间通信。默认为 GSSAPI。 串 GSSAPI 中 每个经纪 人 sasl.server.callback.han dler.class 实现AuthenticateCallbackHandler接口的SASL服务器回调处理程序类的 标准名称。服务器回调处理程序必须以小写的前缀和侦听器前缀和 SASL 机 制名称作为前缀。例如, listener.name.sasl_ssl.plain.sasl.server.callback.handler.class = com.example.CustomPlainCallbackHandler。 类 空值 中 只读 security.inter.broker.pr otocol 用于在代理之间进行通信的安全协议。有效值包括:PLAINTEXT,SSL, SASL_PLAINTEXT,SASL_SSL。同时设置 this 和 inter.broker.listener.name 属性是错误的。 串 纯文本 中 只读 ssl.cipher.suites 密码套件列表。这是用于使用 TLS 或 SSL 网络协议协商网络连接的安全设 置的身份验证,加密,MAC 和密钥交换算法的命名组合。默认情况下,支持 所有可用的密码套件。 名单 “” 中 每个经纪 人 ssl.client.auth 配置 kafka 代理以请求客户端身份验证。以下设置很常见:  ssl.client.auth=required如果设置为所需的客户端身份验证。  ssl.client.auth=requested这意味着客户端验证是可选的。与请求不同, 如果设置了此选项,则客户端可以选择不提供有关自身的身份验证信息  ssl.client.auth=none这意味着不需要客户端身份验证。 串 没有 [必填,要求,无] 中 每个经纪 人 ssl.enabled.protocols 为 SSL 连接启用的协议列表。 名单 TLSv1. 2 工作, TLSv1. 1,使用 TLSv1 中 每个经纪 人 ssl.key.password 密钥库文件中私钥的密码。这对于客户来说是可选的。 密码 空值 中 每个经纪 人 ssl.keymanager.algorithm 密钥管理器工厂用于 SSL 连接的算法。默认值是为 Java 虚拟机配置的密钥 管理器工厂算法。 串 SunX50 9 中 每个经纪 人 ssl.keystore.location 密钥库文件的位置。这对于客户端是可选的,可用于客户端的双向身份验 证。 串 空值 中 每个经纪 人 ssl.keystore.password 密钥库文件的商店密码。这对于客户端是可选的,仅在配置了 ssl.keystore.location 时才需要。 密码 空值 中 每个经纪 人 ssl.keystore.type 密钥库文件的文件格式。这对于客户来说是可选的。 串 JKS 中 每个经纪 人 ssl.protocol 用于生成 SSLContext 的 SSL 协议。默认设置为 TLS,在大多数情况下都可 以。最近的 JVM 中的允许值是 TLS,TLSv1.1 和 TLSv1.2。较旧的 JVM 可能 支持 SSL,SSLv2 和 SSLv3,但由于已知的安全漏洞,不鼓励使用它们。 串 TLS 中 每个经纪 人 ssl.provider 用于 SSL 连接的安全提供程序的名称。默认值是 JVM 的默认安全提供程序。串 空值 中 每个经纪 人 ssl.trustmanager.algorit hm 信任管理器工厂用于 SSL 连接的算法。默认值是为 Java 虚拟机配置的信任 管理器工厂算法。 串 PKIX 中 每个经纪 人 ssl.truststore.location 信任库文件的位置。 串 空值 中 每个经纪 人 ssl.truststore.password 信任库文件的密码。如果未设置密码,则仍可访问信任库,但禁用完整性 检查。 密码 空值 中 每个经纪 人 ssl.truststore.type 信任库文件的文件格式。 串 JKS 中 每个经纪 人 alter.config.policy.clas s.name alter configs 应该用于验证
2021-11-07 18:36:32 1.65MB kafka
1
二级分类,并且详细的分类包含上百个。
1
约会网站数据集 第一项为每年飞机飞的旅程数第二项为玩游戏所耗时间百分比第三项为每周消费的冰淇淋公升数
2021-10-17 19:57:27 11KB 机器学习
1
机器学习 约会网站数据
2021-10-11 18:08:37 12KB 机器学习 深度学习 人工智能
1
最近开发用到了爬取题库的功能,直接是无法爬取的,通过分析,发现可以通过账号登陆,携带COOKIE信息爬取网站数据。为了方便交流学习,现将代码公开。
2021-10-01 23:53:38 5.96MB MySql java
1