Python语言下使用爬虫工具从求医问药网爬取、解析相应的数据内容,经处理融合后生成结构化数据文件。
以此文件可构建起以疾病为中心的医疗知识图谱,实体规模4.4万,实体关系规模30万。
医药领域知识图谱,主要包含实体约4.4万个,其中包括Check,诊断检查项目,3353;Department,医疗科目,54;Disease,疾病,8807;Drug,药品,3828;Food,食物, 4870;Producer,在售药品,17201;Symptom,疾病症状,5,998。
关系总计约30万条,主要包括属于、疾病常用药品、疾病宜吃食物、药品在售药品、疾病所需检查、疾病忌吃食物、疾病推荐药品、疾病推荐食谱、疾病症状、疾病并发疾病等。
属性包含疾病名称、 疾病简介、疾病病因、预防措施、治疗周期、治疗方式、治愈概率、疾病易感人群等
1