大数据常用脚本.rar
2021-05-12 18:05:39 4KB 大数据 实时大数据
1
ddcompiler_47.dll
2021-05-10 19:00:06 3.55MB 实时大数据
1
实时大数据分析minhash算法 报告,源代码和数据集 采用Minhash技术两个文本数据集Amazon News和Google Report的Jaccard相似度,给出两个集合中每条记录在另一个集合中相似度最高的记录,作为匹配结果输出。
2021-05-10 11:05:40 618KB 实时大数据分析 广工 minhash Hadoop
1
gdgfd
2021-05-02 12:00:08 29.26MB 实时大数据
1
Apache Spark中文实战攻略的上册,让你的数据处理更简单,Spark+AI Summit 2020中文精华版峰会全新收录、Apache Spark 3.0性能优化与基础实战一书看遍,详细讲述了Apache Spark的前世今生、Spark SQL性能如何优化及改进方案、Delta Lake深度解析等内容,很不错,快来下载吧。
2021-04-29 17:08:15 4.13MB spark 大数据 实时大数据 性能优化
这是基于python爬虫技术编程写的关单数据爬虫系统,实现全球海关、关单、外贸数据的爬取。框架采用python多线程技术+request+代理IP池,实现了每天几十亿家采购商供应商外贸和关单数据实时采集和更新。
1
这是基于python爬虫技术编程写的外贸数据爬虫系统,实现全球海关、关单、外贸数据的爬取。框架采用python多线程技术+request+代理IP池,实现了每天几十亿家采购商供应商外贸和关单数据实时采集和更新。
2021-04-27 14:01:26 42.1MB 海量数据挖掘 实时大数据 python saas
1
这是基于python爬虫技术编程写的外贸电商数据爬虫系统,实现全球海关、关单、外贸数据的爬取。框架采用python多线程技术+request+代理IP池,实现了每天几十亿家采购商供应商外贸和关单数据实时采集和更新。
2021-04-27 13:13:10 42.1MB 实时大数据 爬虫 海量数据挖掘 python
1
这是基于python爬虫技术编程写的中国关单数据爬虫系统,实现全球海关、关单、外贸数据的爬取。框架采用python多线程技术+request+代理IP池,实现了每天几十亿家采购商供应商外贸和关单数据实时采集和更新。
2021-04-27 13:10:36 42.1MB 实时大数据 python 海量数据挖掘 saas
1