数据录入过程、数据整合过程都可能会产生重复数据,直接删除是重复数据处理的主要方法。pandas提供查看、处理重复数据的方法duplicated和drop_duplicates。以如下数据为例:发现重复数据通过duplicated方法完成,如下所示,可以通过该方法查看重复的数据。需要去重时,可drop_duplicates方法完成:drop_duplicates方法还可以按照某列去重,例如去除id列重复的所有记录:缺失值是数据清洗中比较常见的问题,缺失值一般由NA表示,在处理缺失值时要遵循一定的原则。首先,需要根据业务理解处理缺失值,弄清楚缺失值产生的原因是故意缺失还是随机缺失,再通过一些业务经
1
本文来自作者李文哲,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、前沿领域以及整体知识架构达到多学科融合目的的现代理论。从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。对于读者,我们不要求有任何AI相关的背景知识。随着移动互联网的发展,
1
主要介绍了iOS中关于模块化开发解决方案(纯干货)的相关资料,非常不错,具有参考借鉴价值,需要的朋友可以参考下
2021-02-21 11:54:42 266KB ios 模块化开发
1
编者按:想成为一个能解决问题的设计师,光靠笔头功夫还不行,今天阿里的同学聊聊如何通过数据帮设计师发现问题,判断思路+验证方案,全程都是实战经验,图例清晰,逻辑分明,希望给容易迷茫的设计师来一针实在的,不喝鸡汤了!
1
在上篇《APP界面设计风格》确定下来后,产品经理(兼交互设计)还不用着急将所有的交互稿扔给设计师进行细致的界面设计。在细节设计启动前,拉上设计师和安卓前端开发、ios前端开发一起商议确定设计规范先吧!APP设计规范指对APP界面进行风格统一,对界面元素的样式、颜色和大小设定统一的规范和使用原则。与设计、前端约定好统一的设计规范很重要,约定设计规范可以减少产品、设计、前端的沟通成本;可以使界面设计整洁、统一,减少界面元素的重复设计;可以减少设计素材,控制安装包的大小。APP设计规范主要包括对界面布局、背景色、字体颜色大小、界面元素间距、弹层、loading、图标、按钮常态点击态等进行统一的梳理和
1
有编程基础,学过c和java,纯干货Python学习笔记 时间充裕的推荐看视频学习,时间较紧的可以看我的笔记 有问题欢迎斧正 视频链接会在最后一个笔记中附上
2021-02-11 22:03:05 1.15MB Python 干货
有编程基础,学过c和java,纯干货Python学习笔记 时间充裕的推荐看视频学习,时间较紧的可以看我的笔记 有问题欢迎斧正 视频链接会在最后一个笔记中附上
2021-02-09 19:04:54 1.28MB 干货 Python
有编程基础,学过c和java,纯干货Python学习笔记 时间充裕的推荐看视频学习,时间较紧的可以看我的笔记 有问题欢迎斧正 视频链接会在最后一个笔记中附上
2021-02-02 15:35:37 1.52MB 干货 Python
基于IPD的研发项目管理(没有废话,全是干货)
2021-02-02 12:34:18 4.31MB IPD
1