数据跟踪器
用于流数据源的基于内容标识符的注册表的概念验证
目标
给定URL上的数据可能会定期更改,甚至会连续更改。 这与我们可能用于预测的数据尤其相关,例如来自NOAA或NASA的环境数据或来自NEON的生态数据。 这样的数据源很少具有DOI,并且每次我们根据它们进行预测时都为这些源创建DOI通常是不切实际的(请参阅 )。 该存储库概述了一种简单的替代方法。
我们想要一个自动化的工作,该工作:
观看网址
计算找到的数据的每个唯一副本的标识符(或用于进行预测的标识符)
存档找到的数据的每个新副本
允许我们使用其标识符检索该数据的精确副本。
方法
正如Ben Trask,Jorrit Poelen和其他人所建议的那样,我们将使用简单的内容哈希总和作为标识符,而不是将DOI用于该标识符。 (请注意,此方法与git , dat , IPFS和其他基于内容的系统的方法不同,因为它更简单-无需
2021-02-20 09:05:18
2.31MB
R
1