GDELT冲突数据集1.0(2021) 免责声明 我将此数据集构建为个人项目。 它没有任何保证。 随意将其用于您自己的项目或文章,但请承认我。 并记住要引用GDELT项目及其 我将来可能会发布新版本,但不能保证。 如果您分析数据,请告诉我。 我很想看看你发现了什么。 介绍 该存储库记录了2021年GDELT冲突数据集的来源。 可对世界各地的新闻媒体进行持续监控。 它的档案可以追溯到1979年1月1日。该数据库据说每15分钟更新一次。 他们的任务是“建立世界所有国家的人类社会规模的行为和信仰目录”。 GDELT冲突数据集利用GDELT来检查过去40年中冲突的演变。 它汇总了1979年至2021年期间从258个国家的媒体报道中提取的超过8,300万个事件的信息。 这些事件分为32个类别,描述了各种规模的冲突行为,例如“没收财产,进行自杀炸弹袭击”,“占领领土”。 希望该数据集可以
2022-06-27 16:54:29 11.18MB JupyterNotebook
1
GDELT入门 一些有关使用“事件,位置和音调的全局数据”的快速教程。 在NBViewer中查看 2015年更新 ,您无需下载任何内容即可立即分析数据集。 检查一些资源: 。 。 。
2022-05-05 13:24:45 1.81MB CSS
1
GDELT数据采集 一个简单的Python脚本即可从(该数据集是理解全球人类社会的最大的开放数据集)中获取数据的,它用152种语言提供了跨越200年的总计8.1万亿个数据点。 事件数据库包含超过25亿条记录,这些记录按数据组织成一组由制表符分隔的文件。 到2013年3月31日,记录将在活动发生之日以月度和年度文件存储。 从2013年4月1日开始,每天都会创建文件,并按照事件在世界新闻媒体中发现的日期(而不是事件发生的日期)存储记录。 我们的重点是该数据库的1.0版,该数据库每天都会在更新为一个新条目。 描述 该脚本从GDELT项目事件数据库v1.0原始数据中提取事件的数据集,并使用CAMEO分类法按所需事件类型进行过滤,并使用FIPS 10-4国家/地区代码对所需采取行动的国家/地区进行过滤。 给定的输出是一个逗号分隔的值文件,其中包含给定事件和国家集的已标识事件。 依存关系 该脚本在
2021-12-10 15:59:19 21KB events gdelt datamining socialscience
1
Linux and Mac OS Windows OS Module Version Coverage Downloads gdeltPyR gdeltPyR是一个基于Python的框架,用于访问和分析Python Pandas或R数据数据。 用户可以输入单个日期,日期范围(两个字符串的列表)或单个日期(列表中的两个以上),并返回。 Python 2即将退休。 因为gdeltPyR依赖于将终止对Python 2支持的几个库,所以谨慎地做同样的事情。 在接下来的几个月中,Python 2中的gdeltPyR功能将变得有问题。 移至Python 3以获得最佳体验。 gdeltPyR通过检索 ,并将提供一种的方法。 因此,您拥有的内核越多,提取更多数据所需的时间就越少。 此外,您拥有更多的RAM,您可以拉取更多的数据。 最后,对于RAM受限的工作流,创建一个用于提取数据,写入磁盘和
2021-11-29 22:11:39 2.56MB python news geolocation data-frame
1
加特尔工具包 带有CLI和模块绑定的用于下载,解析和数据的工具 CLI API npm install -g gdelt-toolkit gdelt [args] Commands: gdelt download get gdelt by datetime gdelt lint lint gdelt by datetime gdelt clean clean cache 下载 下载GDELT文件并以JSON或N3格式输出以指定UTC日期时间(ISO-8601)。 GDELT文件每隔15分钟发布一次; 省略datetime arg将下载当天的第一个文件。 下载内容在本地缓存。 为和定义了用于解析GDELT tsv文件的默认规则。 gdelt download [-d YYYY-MM-DD | YYYY-MM-DDThh:mm] [-f]
2021-11-28 21:19:41 55KB JavaScript
1
python多线程抓取GDELT资源
2021-10-13 16:00:55 6KB GDELT Python
1
gdelt
2021-01-28 01:44:52 18KB gdelt
1