上传者: sdgfbhgfj
|
上传时间: 2022-05-02 11:06:57
|
文件大小: 3KB
|
文件类型: SAV
carpet_prefs.sav
该数据文件所基于的示例和在 carpet.sav 中所描述的一样,但它还包含从 10 位消费者的每一位中收集到的实际排列顺序。消费者被要求按照从最喜欢到最不喜欢的顺序对 22 个产品概要文件进行排序。carpet_plan.sav 中定义了变量 PREF1 到 PREF22 包含相关特征的标识。
统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵;
纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。
常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;