NLP医疗保健
使用MIMIC III中的结构化和非结构化数据预测30天ICU再次入院
数据处理
结构化数据
结构化网络的ETL过程可以在结构目录中找到在structured_etl_part1.scala和structured_etl_part2.py
非结构化数据
非结构化数据的所有数据处理脚本都包含在dataproc目录中。
使用data_processing_script.py处理NOTEEVENTS以获取单词向量。
使用get_discharge_summaries.py编写放电汇总
使用build_vocab.py从放电摘要构建vocab。
使用word_embeddings.py在所有单词上训练单词嵌入。
使用extract_wvs.py中的gensim_to_embeddings方法,用我们的vocab编写经过训练的单词嵌入。
造型
结构化网络
在struc_net
2024-01-12 16:29:11
68KB
Python
1