java求集合的交集源码蒙德里安
Mondrian
是
Kristen
LeFevre
在他的论文中提出的一种用于关系数据集的自顶向下贪婪数据匿名化算法[1]。
据我们所知,蒙德里安是最快的本地记录算法,同时保留了良好的数据效用。
尽管
LeFevre
在他的论文中给出了伪代码,但原始源代码并不可用。
您可以在
Anonymization
Toolbox[2]
中找到第三部分
Java
实现。
该存储库是Mondrian
的开源
Python
实现。
动机
数据隐私的研究已经持续了十多年,发表了大量优秀论文。
然而,互联网上只有少数开源项目[2-3],大多数开源项目使用的是2004年之前提出的算法!
在现实生活中使用的项目较少。
更糟糕的是,大多数人甚至没有听说过。
这样的悲剧!
我决定做一些努力。
希望这些开源存储库可以帮助研究人员和开发人员进行数据隐私(隐私保护数据发布、数据匿名化)。
注意力
这个蒙德里安是[1]中最早提出的蒙德里安,它对每个属性强加了一个直观的排序。
因此,分类属性没有泛化层次结构。
这种操作带来了更低的信息损失,但更糟糕的语义结果。
如果您想要基于泛化层次结构
2021-12-02 17:17:46
2.98MB
系统开源
1