上传者: 38721252
|
上传时间: 2022-05-22 16:22:47
|
文件大小: 32KB
|
文件类型: PDF
sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split
from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)
得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。
若train_test_spli