目录:
一、介绍
二、最值归一化
1.计算公式
2.Python实战
三、均值方差归一化
1.计算公式
2.Python实战
四、归一化要点
五、使用scikit-learn进行数据归一化
一、介绍
为什么需要进行数据归一化?
举个简单的例子,样本1以[1, 200]输入到模型中去的时候,由于200可能会直接忽略到1的存在。此时样本间的距离由时间所主导。
此时,如果将天数转换为占比1年的比例,200/365=0.5479, 100/365=0.2740。但也导致样本间的距离又被肿瘤大小所主导。因此有必要进行数据归一化处理。不然直接计算样本间的距离是有一定偏差的。
解决方案:
将所有的数据映
1