质量检查
2023-03-18 20:09:23 11.84MB 系统开源
1
本文章以 丁香 医生为例 主要以 科目分类来进行爬取,每个科目爬取的内容会存储到一个文本文档中,内容是问答式。 代码如下: from bs4 import BeautifulSoup import pandas as pd import json import requests import time import random def get_static_url_content(url): headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, l
2021-10-06 15:35:24 26KB 医疗 数据
1
中文医疗问答数据-好大夫.zip
2021-08-27 18:07:08 853.12MB 问答数据 医疗
1
本文主要是对在线问诊中产生的医疗文本进行命名实体识别的研究.使用在线医疗问答网站的数据,采用{B,I,O}标注体系构建数据集,抽取疾病、治疗、检查和症状四个医疗实体.以BiLSTM-CRF为基准模型,提出两种深度学习模型IndRNN-CRF和IDCNN-BiLSTM-CRF,并在自构建数据集上验证模型的有效性.将新提出的两种模型与基准模型通过实验对比得出:模型IDCNN-BiLSTM-CRF的F1值0.8116,超过了BiLSTM-CRF的F1值0.8009,IDCNN-BiLSTM-CRF整体性能好于BiLSTM-CRF模型;模型IndRNN-CRF的精确率0.8427,但该模型在召回率上低于基准模型BiLSTM-CRF.
1
来自某在线求医产品的中文医患对话数据。原始描述:The MedDialog dataset contains conversations (in Chinese) between doctors and patients.
1
通过BeautifulSoup库的ask120爬虫代码,分为科室链接爬取,问答链接爬取,问答详情爬取、医生信息爬取三个部分。
2019-12-21 21:11:57 13KB 医疗问答数据
1
基于neo4j的简易医疗问答知识图谱,数据从ask120中爬取得到
2019-12-21 20:28:52 78KB 知识图谱
1