用各种机器学习算法预测上海房价,从链家网爬取的上海市各二手房数据进行训练,非线性决策树优于线性回归优于神经网络 摘要: 本文主要分析影响房价的因素,数据来源为链家网,机器学习模型的使用中,采用了三种线性模型,一种非线性模型,最后得出的结论是房子的大小,房子的位置,房子的建造年份以及房子的高度对房价影响较大。 问题描述 现在房价居高不下,特别是上海等一线城市,房价更是高的离谱,那么在决定一个房子的价格中,哪些因素占了主要的地位,如何让想买房的人快速获取大概的房价信息。那么本文介绍的就是如何用机器学习去训练上海房价信息并生成模型然后进行分析的过程。 数据收集及处理 数据源选择 经过在网上对几个房价信息网的比较,
2023-03-23 18:39:07 998KB 机器学习 房价预测 线性回归
1
4.1 电子病历实体关系抽取任务 电子病历命名实体关系抽取主要研究从电子病 历中抽取疾病、症状、检查和治疗这几类实体间的 关系. 这些实体关系体现了患者健康状况信息和针 对患者的医疗处置措施, 也体现了医生的专业知识. 如下面的例子: 1) 头 CT 检查显示腔隙性脑梗死 (检查 “头 CT” 证实了疾病 “腔隙性脑梗死”); 2) 患者彩超结果汇报轻度脂肪肝、慢性胆囊炎, 给予饮食指导, 继续治疗方案 (“彩超” 证实了 “轻度 脂肪肝” 和 “慢性胆囊炎”, “饮食指导” 施加于 “轻 度脂肪肝” 和 “慢性胆囊炎”). 电子病历实体关系抽取任务在命名实体识别基 础上展开, 对病历文本中同一个语句中的两个命名 实体赋予预定义的关系类型, 因而该任务转化为分 类问题, 通常采用基于机器学习的方法实现, 评价指 标采用精确度、召回率和 F 值. 目前电子病历实体 关系只限于一个句子范围内两个实体之间的关系. Uzuner 首先对医疗实体关系抽取进行了开创 性的研究, 详细定义了六大类医疗实体关系: 当前疾 病和治疗的关系、可能的疾病和治疗的关系、疾病 (包括当前的和可能的) 和检查的关系、疾病和症状 的关系、当前症状和治疗的关系、可能的症状和治 疗的关系[3]. 如果已经定义了修饰识别任务, 实现了 疾病和症状的修饰识别, 那么在关系抽取时, 可以不 考虑修饰的影响, 直接抽取实体间的关系, 然后借助 实体的修饰, 可以得到文献 [3] 定义的上述各类关 系. 所以, 在 I2B2 2010 评测中, 实体关系的定义没 有考虑修饰的因素. I2B2 2010 首次对电子病历命 名实体关系进行了系统的分类[12], 这些关系包括医 疗问题和医疗问题之间的关系、医疗问题和检查之 间的关系、医疗问题和治疗之间的关系. 这三类关系 以医疗问题为中心, 反映了电子病历面向医疗问题 的信息组织方式. 这三类关系只限于一个句子范围 内两个实体之间的关系. 表 5 详细列出了医疗问题、 检查和治疗这三类实体间的关系. 针对中文电子病历特点, 医疗问题被拆分为疾 病和症状,那么在定义实体关系时,也应作相应调整. 主要体现在两方面: 1) 医疗问题和治疗 (或检查) 的 关系转变为疾病和治疗的关系以及症状与治疗的 关系, 医疗问题和检查的关系也转变为疾病和检查 的关系以及症状和检查的关系; 2) 医疗问题之间的 关系替换为疾病和症状的关系 (疾病导致了症状)、 疾病和疾病的关系 (疾病导致了另一个疾病)、症状 和症状的关系 (症状伴随另一个症状). 自动抽取这几类实体间的关系可以构造患者健 康状况的简明摘要, 医生可以预先快速浏览病人的 信息, 后续再关注特定的细节. 除了可以用作医疗研 表 4 疾病和症状的修饰识别方法总结 Table 4 Summarization of methods for assertion classification 作者 方法 用到的资源 数据 评价 (F 值) Chapman 等[13] (NegEx) 规则 正则表达式规则 出院小结 0.853 Mutalik 等[105] (Negfinder) 规则 正则表达式规则、句法规则 自建语料 0.965 Sohn 等[106] (DepNeg) 规则 依存规则 I2B2 2010 评测数据 0.838 Harkema 等[107] (ConText) 规则 正则表达式规则、触发词 6 种类型的病历文本 0.76∼ 0.93 Uzuner 等[108] SVM / 三个机构的病历 0.35∼ 0.98 Grouin 等[110] SVM NegEx I2B2 2010 评测数据 0.931 Jiang 等[97] SVM MedLEE I2B2 2010 评测数据 0.931 de Bruijn 等[99] SVM cTAKES I2B2 2010 评测数据 0.936 Clark 等[111] CRF、最大熵 语义分类词典、状态规则 I2B2 2010 评测数据 0.934
2023-03-23 11:28:15 979KB EMR 人工智能 智能医疗 电子病历
1
预测模型】基于蚱蜢算法优化支持向量机实现预测分类模型matlab源码.md
2023-03-22 15:04:23 10KB
1
在本文中,解决了四旋翼传递未知时变有效载荷的鲁棒控制问题。 首先,建立了带有有效载荷的四旋翼飞行器模型。 有效载荷的动力学被视为干扰,并被添加到四旋翼模型中。 其次,为了增强系统的鲁棒性,使用扩展状态观察器(ESO)估计来自有效载荷的干扰,以进行反馈补偿。 然后,开发了一种针对多输入多输出(MIMO)系统的预测控制器,以降低由有效载荷的加载/丢失引起的突然变化所造成的影响。 最后,通过与传统的级联比例积分微分(CPID)方法和滑模控制(SMC)方法进行比较,验证了所开发方案的优越性。 仿真结果表明,CPID方法即使在姿态控制上也能达到满意的效果,但在姿态稳定方面却表现不佳,而SMC则表现出输入颤动现象。
2023-03-22 07:18:01 1.97MB 行业研究
1
LSTM是关于遗传算法优化lstm算法的层数和全连接层数及每层神经元的个数 本文的主要内容如下: 1.本文章是对lstm网络的优化,优化的参数主要有:lstm层的层数,lstm隐藏层的神经元个数,dense层的层数,dense层的神经元个数 2.本文章利用的是遗传算法进行优化,其中编码形式并未采用2进制编码,只是将2数组之间的元素交换位置。 3.本文的lstm和dense的层数都在1-3的范围内,因为3层的网络足以拟合非线性数据 4.程序主要分为2部分,第一部分是lstm网络的设计,第二部分是遗传算法的优化。 # 这里将生成一个8维的2进制数,并转换层成bool类型,true表示该位置交叉,False表示不交叉 cross_points = np.random.randint(0, 2, size=DNA_size_max).astype(np.bool) # 用True、False表示是否置换 # 这一部分主要是对针对不做变异的部分 for i, point in
2023-03-21 18:05:24 7KB python 遗传算法 lstm 时间序列预测
1
信息分析预测期末课设_使用ARIMA模型与SVR对一组时间序列数据进行预测分析。从 UCI 数据库中查找 2010 年 1 月至 2010 年 7 月中的每一小时的 PM2.5 指数数据共计 5606 条。并将其对应成时间序列,分别通过 ARIMA 模型与 SVR 模型进行预测分析。详细设计见md文件。
2023-03-21 16:52:45 2.49MB 时间序列预测
1
创业板5 将相关器分支预测器集成到 gem5 周期精确架构模拟器中 在 SConcript 中添加源文件 在 bpred_unit.cc 中为预测器创建一个新对象 将参数添加到 Branchpredictor.py 更改 O3_ARM_v7a.py 中的 predType 构建系统:scons -j8 build/ARM/gem5.debug 为 se 模式编译程序:arm-linux-gnueabi-gcc -DUNIX -o sort sort.c -static 在 se 模式下运行系统: ./build/ARM/gem5.debug --debug-file=trace.out --debug-flags=Fetch,Branch configs/example/se.py -c ./tests/test-progs /hello/bin/arm/linux/sort -
2023-03-21 13:38:33 41KB C++
1
我国顺酐市场分析及其消费量的支持向量机预测,冯详立,王洪礼,通过对我国1995年至2005年顺酐消费量数据的特征分析,运用支持向量机理论对我国 “十一五”期间的顺酐消费量进行了预测
2023-03-21 10:38:01 487KB 首发论文
1
对新疆冰糖心红富士苹果采用高光谱成像技术进行分级和糖度预测研究。在糖度预测分析中,使用正交试验设计方法确定影响预测效果的主要因素是预测回归方法、光谱预处理方法和波长合并,次要因素是光谱校正处理方法、数据类型和实测值归一化处理。提取平均光谱,经过白板校正,采用一阶微分光谱预处理,10个波长的光谱合并,基于多元线性回归方法建立苹果糖度的预测模型,其验证集苹果糖度的预测模型相关系数为0.911,预测均方根误差为0.76%Brix,相对分析误差为2.44。在分级研究中,选择712nm波长图像,Gamma灰度变换增强图像,大津算法阈值确定后分割图像,基于形态学处理剔除果梗区域,提取苹果分割后区域的面积、充实度、周长、平均灰度等特征,采用二次判别分析分级苹果,验证集苹果分级准确率达到89.5%。结果表明,高光谱图像技术既能够准确预测新疆冰糖心红富士苹果糖度品质,也可以用于基于外部品质特征的分级研究。
1
在对实际生产部门工艺流程和排产方式进行分析的基础上,建立有关模型,提出基于遗传算法的优化计算方法,并将其应用于生产调度系统中,对生产线上排产调度进行优化,取得令人满意的效果。该方法对解决实际优化调度问题以及现场人员的实际生产调度工作,都具有一定指导意义。
2023-03-20 17:30:59 227KB 自然科学 论文
1