如何以负责任的方式开发机器学习模型?有几个主题值得考虑:
有效。模型够好吗?不应使用性能低下的模型,因为它们弊大于利。用用户理解的语言传达模型的性能。请记住,模型将在与训练数据集不同的数据集上工作。确保评估目标数据集的性能。
透明的。用户是否知道影响模型预测的因素?可解释性和可解释性很重要。如果模型决策直接或间接影响我们,我们应该知道这些决策来自何处以及如何更改它们。
公平。模型是否基于性别、年龄、种族或其他敏感属性进行区分?直接还是间接?它不应该!歧视可能出现在许多方面。该模型可能给出较低的分数,可能具有较低的性能,或者可能基于受保护人群的不同变量。
安全。不要让您的模型被黑客入侵。每个复杂的系统都有它的弱点。找出并修复它们。一些用户可能会使用各种技巧将模型预测拉到他们的网站上。
机密。模型通常建立在敏感数据之上。确保数据不会泄露,以免敏感属性与未经授权的人员共享。还要注意模型泄漏。
可重现。通常模型开发过程包括许多步骤。确保它们是完全可重现的,因此可以一一验证。
更多详情、使用方法,请下载后阅读README.md文件
2022-07-04 18:03:57
18.51MB
r语言