表评估器 TableEvaluator是一个库,用于评估合成数据集与真实数据的相似程度。 换句话说,它试图指出伪造数据的真实程度。 随着专门为表格数据设计的GAN的兴起,许多应用正在成为可能。 对于像金融,医疗保健和goverments行业,不必创建不具有正常数据的隐私限制高品质的合成数据的能力是非常有价值的。 由于这个领域还很年轻并且正在发展,所以我创建了这个库,以便为您的模型提供一致的评估方法。 安装 该软件包可以安装 pip install table_evaluator 测验 可以通过克隆存储库并运行以下命令来运行测试: pytest tests 用法 请参阅示例笔记本以获取最新示例。 README示例只是该笔记本,但有时有些过时。 从导入类开始 from table_evaluator import load_data , TableEvaluator 该包通过具有两个
2022-12-07 09:03:48 1.24MB data evaluation generation synthetic
1
贷款违约数据集含有 年龄、教育、工龄、地址、收入、负债率、信用卡负债、其他负债以及违约情况的字段。通过各特征来判断用户的违约情况。用到的技术模型如下 逻辑回归 面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。 k近邻法(k-nearest neighbor,k-NN) 一种基本的分类和回归方法,是监督学习方法里的一种常用方法。k近邻算法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实例,根据其k个最近邻的训练实例类别,通过多数表决等方式进行预测。 决策树 一种基于树结构来进行决策的分类算法,我们希望从给定的训练数据集学得一个模型(即决策树),用该模型对新样本分类。决策树可以非常直观展现分类的过程和结果,一旦模型构建成功,对新样本的分类效率也相当高。 SVM(Support Vector Machine) 中文名为支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。 模型评估 可以根据混淆矩阵。得到其Accuracy准确率以及F1 score
2022-12-06 15:52:04 8KB scikit-learn 机器学习 分类模型 Python
1
云计算综合运维
2022-12-06 09:22:04 705KB 云计算 综合运维
1
云计算综合运维
2022-12-06 09:22:03 815KB 云计算 综合运维
1
云计算综合运维
2022-12-06 09:22:01 1.05MB 云计算 综合运维
1