carpet.sav
在常用示例5中,有一家公司想要销售一种新型的地毯清洁用品。该公司希望调查以下会对消费者偏好产生影响的五个因素:包装设计、品牌名称、价格、优质家用品标志、以及退货保证。包装设计有三个因子级别,每个因子级别因刷体位置而不同;有三个品牌名称(K2R、Glory 和 Bissell);有三个价格水平;最后两个因素各有两个级别(有或无)。十名消费者对这些因素所定义的 22 个特征进行了排序。变量优选包含对每个概要文件的平均等级的排序。低等级与高偏好相对应。此变量反映了对每个概要文件的偏好的总体度量。
统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵;
纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。
常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:06:58
1KB
R
spss
1