simplemed-etl
用于分析患者数据以进行研究的 ETL 和可视化工具。
介绍
患者护理研究通常只需要分析简单的数据和统计数据,如人口统计、住院时间、重新入院等。典型的工作流程始于一份来自电子病历 (EMR) 的数千条记录的报告。 这个库提供了一个框架来处理这些数据。 它包含用于过滤和转换数据的 Python 函数以及用于将其可视化为图形和表格的 UI。
入门
分叉这个项目。
为您的特定数据集量身定制。 例如,请参阅。
提取、转换、加载
数据集
该库面向处理少量(数千条记录,总计兆字节)的简单数据(姓名、人口统计数据、药物等)。 ETL 部分一次对内存中的整个数据集进行操作。 它不会从磁盘流式传输大型数据集或执行流水线或记录。
数据集在 ETL 部分和 UI 中都表示为字典列表。 列表中的每一项代表一行:
data = [
{'name': 'john doe'
1