上传者: lqf058723dtt
|
上传时间: 2022-05-03 17:05:54
|
文件大小: 270MB
|
文件类型: WMV
机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测
离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所
有这些数据全部都是整数,而且不能再细分,也不能进一步提高他
们的精确度。
连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续
的,如,长度、时间、质量值等,这类整数通常是非整数,含有小数
部分。
注:只要记住一点,离散型是区间内不可分,连续型是区间内可分
结构:特征值+目标值
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型Python语言的机器学习工具
Scikit-learn包括许多知名的机器学习算法的实现
Scikit-learn文档完善,容易上手,丰富的API,使其在学术界颇受欢迎。
目前稳定版本0.18
准确性
特征抽取针对非连续型数据
特征抽取对文本等进行特征值化
通过特定的统计方法(数学方法)将数据转换成算法要求的数据