topModel:来自Google的Github公共数据集的一些简短主题建模
1
以太坊ETL 以太坊ETL可让您将区块链数据转换为方便的格式,例如CSV和关系数据库。 您是否只想立即查询以太坊数据? 使用的。 。 快速开始 安装以太坊ETL: pip3 install ethereum-etl 导出块和事务( , ): > ethereumetl export_blocks_and_transactions --start-block 0 --end-block 500000 \ --blocks-output blocks.csv --transactions-output transactions.csv \ --provider-uri https:/
2021-12-20 23:48:02 600KB export bigquery aws csv
1
玛拉示例项目 一个可运行的应用程序,演示了如何使用mara构建数据仓库。 将库和库与框架结合到一个项目中。 示例ETL将PyPi下载统计信息和GitHub回购活动度量标准集成到了更通用的Python项目活动统计信息中。 该存储库旨在用作新项目的模板。 示例:Python项目统计 该项目使用两个数据源: 在 (需要Google登录)上BigQuery数据集。 它包含每个单独的软件包下载以及项目和客户端属性。 BigQuery资料集位于 。 它几乎包含所有发生在Github存储库中的事件。 从两个数据源中,使用的查询以增量方式下载一组预先聚合和过滤的CSV: $ gunzip --decompress --stdout data/2018/04/10/pypi/downloads-v1.csv.gz | grep " \tflask\t\|day_id " | head -n 11 day_id project project_version python_version installer number_of_downloads 20180410 flask 0.1 ban
2021-01-30 23:04:36 17.65MB bigquery sql etl pypi
1