上传者: 38743602
|
上传时间: 2023-01-27 14:57:10
|
文件大小: 334KB
|
文件类型: PDF
数值特征
离散值处理
数值特征的处理,最常见的方法,就是离散值处理了
对于一份新拿到手的数据来说,会有很多不能被计算机识别的数据,这就需要对它们进行处理
LabelEncoder
import pandas as pd
import numpy as np
# 加载数据
vg_df = pd.read_csv('datasets/vgsales.csv', encoding = ISO-8859-1)
vg_df[['Name', 'Platform', 'Year', 'Genre', 'Publisher']].head()
# 拿到某个特征的离散数据
genres = np.uniq