上传者: 38557670
|
上传时间: 2022-06-14 21:01:34
|
文件大小: 74KB
|
文件类型: PDF
一、对DataFrame的认知
DataFrame的本质是行(index)列(column)索引+多列数据。
为了简化理解,我们不妨换个思路…
现实中,为了简化对一件事物的描述,我们会选择几个特征。
例如,从(性别、身高、学历、职业、爱好..)等角度去刻画一个人,这些“角度”即为“特征”。
其中,不同的行表示不同的记录;列代表特征,不同记录因各个特征之间的差异而不同。
DataFrame默认索引是序号(0,1,2…),可以理解成位置索引。一般我们用id标识不同记录,不会改变index。但为了理解不同特征(列)含义,我们往往会重新指定column。
一些简易但不算严谨的理解是:
行列
行 –