探索海量在线数据集时面临的内在机遇和挑战 学习如何使用地图和数据“混搭”方式对都市犯罪趋势进行可视化 发现“众包”和透明如何改进药物研究现状 理解当新的数据和之前存在的数据交叠时如何向用户发送警告 学习处理DNA数据的大规模基础设施
2021-08-26 00:30:17 31.34MB 数据挖掘 数据分析
1
《Python广告数据挖掘与分析实战》配套代码 本书目前在京东或者当当上均可进行购买,下面附上购买链接 京东: 当当: 注:由于书中部分内容涉及到实际业务数据,不太方便公开,所以github上的部分代码以及代码中所使用到的数据源可能与书中不太一致,但整体代码和实现方式保持不变, 请读者朋友们以github上的数据源和代码为准! 如有疑问可以在数据挖掘与AI算法微信公众号上随时与我联系。感谢大家的支持!
2021-08-24 21:42:34 1.13MB JupyterNotebook
1
第一章:引言(2学时) 第二章:文本特征提取技术(4学时) 第三章:文本检索技术(6学时) 第四章:文本自动分类技术(3学时) 第五章:文本自动聚类技术(3学时) 第六章:话题检测与追踪(3学时) 第七章:文本过滤技术(1.5学时) 第八章:关联分析技术(1.5学时) 第九章:文档自动摘要技术(3学时) 第十章:信息抽取(3学时) 第十一章:智能问答(QA)技术(1.5学时) 第十二章:Ontology(1.5学时) 第十三章:半结构化文本挖掘方法(1.5学时) 第十四章:文本挖掘工具与应用(1.5学时)
第一章:引言(2学时) 第二章:文本特征提取技术(4学时) 第三章:文本检索技术(6学时) 第四章:文本自动分类技术(3学时) 第五章:文本自动聚类技术(3学时) 第六章:话题检测与追踪(3学时) 第七章:文本过滤技术(1.5学时) 第八章:关联分析技术(1.5学时) 第九章:文档自动摘要技术(3学时) 第十章:信息抽取(3学时) 第十一章:智能问答(QA)技术(1.5学时) 第十二章:Ontology(1.5学时) 第十三章:半结构化文本挖掘方法(1.5学时) 第十四章:文本挖掘工具与应用(1.5学时)
第一章:引言(2学时) 第二章:文本特征提取技术(4学时) 第三章:文本检索技术(6学时) 第四章:文本自动分类技术(3学时) 第五章:文本自动聚类技术(3学时) 第六章:话题检测与追踪(3学时) 第七章:文本过滤技术(1.5学时) 第八章:关联分析技术(1.5学时) 第九章:文档自动摘要技术(3学时) 第十章:信息抽取(3学时) 第十一章:智能问答(QA)技术(1.5学时) 第十二章:Ontology(1.5学时) 第十三章:半结构化文本挖掘方法(1.5学时) 第十四章:文本挖掘工具与应用(1.5学时)
共10个章节,由浅入深介绍数据挖掘算法,含配套数据源和源代码 10个章节信息如下: 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap1_intro 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap2_data 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap3_data_exploration 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap4_basic_classification 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap5_alternative_classification 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap6_basic_association_analysis 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap7_extended_association_analysis 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap8_basic_cluster_analysis 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap9_advanced_cluster_analysis 精品 干货 数据挖掘数据分析配套纯英文版教程课件 chap10_anomaly_detection
干货课件,值得拥有,8个章节信息如下: (1)数据挖掘概述 (2)数据预处理 (3)数据挖掘算法-分类与预测 (4)数据挖掘算法-聚类 (5)数据挖掘算法-关联分析 (6)序列模式挖掘 (7)数据挖掘软件 (8)数据挖掘应用 最后含一个示例:加热炉生产质量数据挖掘 挖掘步骤如下: (1)样本抽取: 每加热一炉钢锭的生产历史数据记录为一组样本。 (2)数据挖掘步骤: 数据清洗:去除野值、数据平滑(移动平均) 模式抽取:所有样本各抽取10个特征模式 若用于质量预测: 主元分析:去除次要特征模式; 分类分析:建立质量分类模型(决策树); 若用于质量分析: 主元分析:去除次要特征模式; 相关分析:计算主要特征模式与钢锭内裂之间的相关度; 结果验证:用测试样本集对挖掘结果进行测试 结果输出:输出质量分类决策树或质量相关分析结果。
•威胁不价值 •沙箱分析价值输出 •协同实例
2021-08-11 09:00:11 1.74MB 威胁情报 沙箱 数据挖掘 安全分析
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。 •获得对社交网络世界的直观认识 •使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据 •学习如何应用便捷的Python工具来交叉分析你所收集的数据 •通过XHTML朋友圈探讨基于微格式的社交联系 •应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术 •通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
1
知网Hownet情感词典
2021-08-10 09:07:45 89KB 文本挖掘 数据挖掘 情感分析
1