上传者: p1q2r
|
上传时间: 2026-01-16 17:20:17
|
文件大小: 34.33MB
|
文件类型: PDF
本书系统讲解使用Python进行数据清洗的核心技术,涵盖pandas、NumPy、Matplotlib及scikit-learn等主流工具。从导入CSV、Excel、数据库到处理JSON、HTML和Spark数据,全面覆盖数据预处理流程。深入探讨缺失值处理、异常值检测、数据重塑与自动化清洗管道构建。结合真实案例与OpenAI辅助分析,帮助读者高效准备高质量数据,为后续数据分析与机器学习打下坚实基础。适合数据分析师、数据科学家及Python开发者阅读。