反事实解释作为解释机器学习模型决策的一种方式,在技术、法律和商业界越来越受到重视。 这些解释与美国信用法要求的长期确立的“主要理由”解释具有共同特征:它们都通过突出一组被认为最相关的特征来解释决策——并隐瞒其他特征。这些“突出特征的解释”有几个可取的属性:它们对模型的复杂性没有限制,不需要模型披露,详细说明实现不同决策所需的不同之处,并且似乎自动遵守法律。 但它们远比表面看起来复杂和主观。在本文中,我们证明了特征突出解释的效用依赖于一些容易被忽视的假设:特征值的推荐变化清楚地映射到现实世界的动作,可以通过仅查看训练数据的分布来使特征相称,特征仅与手头的决策相关,并且底层模型随着时间的推移是稳定的,单调的,并且仅限于二元结果。然后我们探索几个承认并试图解决这些假设的后果,包括特征突出解释旨在尊重自主性的方式的悖论,特征突出解释赋予决策者不受限制的权力,以及使这些解释有用与需要之间的紧张关系保持模型隐藏。虽然新的研究提出了几种方法来突出特征的解释可以解决一些问题我们发现的问题、模型中的特征与现实世界中的动作之间的脱节——以及补偿这一点所需的主观选择——必须在这些技术得到有效实施之前得到理解。
2022-06-01 22:10:50 279KB interpretability counterfactual explanation
1
汽车价格预测-高度线性预测项目:一种线性回归模型,用于预测美国市场的汽车价格,以帮助新进入者了解美国汽车行业的重要定价变量。 高度全面的分析,详细说明所有步骤; 数据清理,探索,可视化,特征选择,模型构建,评估和MLR假设有效性
1
四、参数的置信区间 参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 在变量的显著性检验中已经知道: 容易推出:在(1-)的置信水平下i的置信区间是 其中,t/2为显著性水平为 、自由度为n-k-1的临界值。
2022-05-04 23:33:02 1.36MB 线性回归
1
accidents.sav 该假设数据文件涉及某保险公司,该公司正在研究给定区域内汽车事故的年龄和性别风险因子。每个个案对应一个年龄类别和性别类别的交叉分类。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:16 843B R spss
1
adl.sav 该假设数据文件涉及在确定针对脑卒中患者的建议治疗类型的优点方面的举措。医师将女性脑卒中患者随机分配到两组中的一组。第一组患者接受标准的物理治疗,而第二组患者则接受附加的情绪治疗。在进行治疗的三个月时间里,将为每个患者进行一般日常生活行为的能力评分并作为原始变量。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:16 3KB R spss
1
advert.sav 该假设数据文件涉及某零售商在检查广告支出与销售业绩之间的关系方面的举措。为此,他们收集了过去的销售数字以及相关的广告成本。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:15 893B R spss
1
bankloan.sav 该假设数据文件涉及某银行在降低贷款拖欠率方面的举措。该文件包含 850 位过去和潜在客户的财务和人口统计信息。前 700 个个案是以前曾获得贷款的客户。剩下的 150 个个案是潜在客户,银行需要按高或低信用风险对他们进行分类。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:09 52KB R spss
1
bankloan_binning.sav 该假设数据文件包含 5,000 位过去客户的财务和人口统计信息。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:09 198KB R spss
1
brakes.sav 该假设数据文件涉及某生产高性能汽车盘式制动器的工厂的质量控制。该数据文件包含对 8 台专用机床中每一台的 16 个盘式制动器的直径测量。盘式制动器的目标直径为 322 毫米。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:05 2KB R spss
1
broadband_1.sav 该假设数据文件包含各地区订制了全国宽带服务的客户的数量。该数据文件包含 4 年期间 85 个地区每月的订户数量。 统计分析及模型构建中常用的数据集、使用数据集可以对模型和算法进行快速验证,而且如果能够得到经典测试数据有助于我们复现大佬(巨佬)们提供的算法模型、达到实战联系的目的、真正从原理上开启数据分析、而不是纸上谈兵; 纽约时报的一篇文章报道,数据科学家在挖掘出有价值的“金块”之前要花费50%到80%的时间在很多诸如收集数据和准备不规则的数据的普通任务上。混乱的数据是数据科学家工作流中典型的比较耗费时间的。 常用的数据集可以帮助我们快速实验模型算法,因为他们都是被处理过的优质数据;
2022-05-02 11:07:03 55KB R spss
1