从症状预测疾病 该项目探索使用机器学习算法来根据症状预测疾病。 探索的算法 在代码中探索了以下算法: 朴素贝叶斯 决策树 随机森林 梯度提升 数据集 源1 与main.py脚本一起使用的此问题的数据集是从此处下载的: https://www.kaggle.com/kaushil268/disease-prediction-using-machine-learning 该数据集共有133列,其中132例是患者经历的症状,以及该患者预后的最后一列。 源2 从此处下载用于Jupyter笔记本的此问题的数据集: https://impact.dbmi.columbia.edu/~friedma/Projects/DiseaseSymptomKB/index.html 该数据集包含3列: Disease | Count of Disease Occurrence | Symptom 您可以将整个表格从此处复制粘贴到excel工作表中,也可以使用Beautifulsoup将其刮下。 目录结构 |_ dataset/ |_ training_data.csv
2021-09-27 15:02:33 3.58MB machine-learning scikit-learn pandas python3
1
DBSCAN1D dbscan1d是一维实现。 创建它是为了在大型1D阵列上高效地执行聚类。 没有一维的特殊情况,因为在这种情况下计算全距离矩阵是浪费的。 最好简单地对输入数组进行排序并执行有效的二等分以找到最接近的点要好得多。 这是运行软件包附带的简单配置文件脚本的结果。 在每种情况下,DBSCAN1D都比scikit Learn的实现快得多。 安装 只需使用pip安装dbscan1d: pip install dbscan1d 它只需要numpy。 快速开始 dbscan1d设计为在几乎所有情况下都可以与sklearn的实现互换。 唯一的例外是weights参数尚不支持。 from sklearn . datasets import make_blobs from dbscan1d . core import DBSCAN1D # make blobs to test clu
1
A-stock-prediction-algorithm-based-on-machine-learning (陆续更新)重新整理过的基于机器学习的股票价格预测算法,里面包含了基本的回测系统以及各种不同的机器学习算法的股票价格预测,包含:LSTM算法、Prophet算法、AutoARIMA、朴素贝叶斯、SVM等 强烈推荐大家去看看sklearn库的文档,地址:[ ] 2021-2-6 出现紧急问题,重新发布 12-3 股票消息面分析 给出一个基于nlp情感分析的消息面分析算法。从新浪财经上获取新闻个股预测情况,使用jieba进行切词和使用snownlp进行情感分析,进行回测。 11-27 修正机器学习算法/DecisionTree.py RandomForest.py 上面的逻辑错误。 11-25 visualization/mlpredict-line.py echarts+tushar
2021-09-27 09:06:31 1.18MB python svm sklearn prophet
1
药物推荐使用审查:针对患者的每种健康状况,分析药物说明,病症,审查,然后使用深度学习模型推荐药物
1
卷积递归神经网络 该软件实现了卷积递归神经网络(CRNN),它结合了CNN,RNN和CTC损失,可用于基于图像的序列识别任务,例如场景文本识别和OCR。 有关详细信息,请参阅我们的论文 。 更新2017年3月14日,一个Docker文件已添加到项目中。 感谢 。 UPDATE 2017年5月1日一PyTorch已作出 。 更新2017年6月19日对于端到端文本检测器+识别器,请通过签出 。 建立 该软件仅在Ubuntu 14.04(x64)上经过测试。 需要启用CUDA的GPU。 要构建项目,请首先安装最新版本的 , 和LMDB。 请分别遵循其安装说明。 在Ubuntu上,可以通过apt-get install liblmdb-dev 。 要构建项目,请转到src/并执行sh build_cpp.sh来构建C ++代码。 如果成功,则应在src/目录中生成一个名为libcrnn.so的文件。 运行演示 演示程序可以在src/demo.lua找到。 在运行演示之前,请从下载预训练的模型。 将下载的模型文件crnn_demo_model.t7放入目录model/crnn_demo/
2021-09-25 15:55:24 67KB machine-learning ocr computer-vision torch7
1
K-类固醇 K-Medoids是一种聚类算法。 围绕类固醇分区(PAM)算法就是这样的一种K-Medoids实现 先决条件 西皮 脾气暴躁的 入门 from KMedoids import KMedoids 参数 n_cluster :集群数 max_iter :最大迭代次数 tol :公差等级 例子 data = [[2, 6], [3, 4], [3, 8], [4, 7], [6, 2], [6, 4], [7, 3], [7, 4], [8, 5], [7, 6]] k_medoids = KMedoids(n_cluster=2) k_medoids.fit(data)
1
皮托伯特 使用PyTorch TransformerEncoder和预训练模型的BERT实现。 安装 pip install pytorch-bert 用法 config = BertConfig . from_json ( "path-to-pretarined-weights/bert_config.json" ) model = Bert ( config ) load_tf_weight_to_pytorch_bert ( model , config , "path-to-pretarined-weights/bert_model.ckpt" ) 将模型文件下载到存储库中。
2021-09-24 00:19:13 18KB nlp machine-learning python3 pytorch
1
datamicroarray:小样本,高维微阵列数据集的集合,用于评估机器学习算法和模型
2021-09-23 21:04:59 90.52MB machine-learning r cancer high-dimensional-data
1
机器学习分类 机器学习分类简介 机器学习用于解决各种预测问题。 借助机器学习,可以预测诸如在急诊室的等待时间,设备故障以及检测网络入侵等情况。 这都是关于在训练数据上训练算法,然后将其知识用于对未知数据进行预测。 一种常见用途是预测垃圾邮件。 通过教授垃圾邮件特征的算法,它可以预测传入的电子邮件是否为垃圾邮件并将该分类设置为电子邮件。 这种类型的机器学习称为机器学习分类,我们将在本教程中进行尝试。 那么机器学习分类的目标是什么? 给定输入后,您希望能够将其分类为属于所有已知类别之一。 对于垃圾邮件,您输入的是电子邮件及其主题,消息,发件人以及该电子邮件中可访问的所有信息。 给定输入,分类器应将其分类为垃圾邮件和not_spam类别之一。 这是怎么做的? 首先要教分类器来自不同类别的电子邮件的外观。 学到足够多的知识后,就可以根据所学到的知识对电子邮件进行分类。 朴素贝叶斯简介 朴素贝
2021-09-23 09:39:47 4.97MB Java
1
破产机器学习 破产数据研究的目的是为给定数据确定预测破产的最佳分类方法。 破产数据是从COMPUSTAT收集的1980年至2000年的数据,其中有5436个观察值和13个变量。 9个基于会计的变量和1个市场变量是:R1:WC / TA,营运资金/总资产R2:RE / TA,未分配利润/总资产R3:EBIT / TA,息税前利润/总资产R4:ME / TL,权益/总负债的市场价值R5:S / TA,销售/总资产R6:TL / TA,总负债/总资产R7:CA / CL,流动资产/流动负债R8:NI / TA,净收入/总资产R9:破产成本,对数(销售)R10:市值,对数(绝对(价格)*流通股数/ 1000) 对于本研究,由于没有明显的破产趋势,因此可以假定可以将多年来的数据汇总在一起并进行研究。 在这13个变量中,其中一个是“ DLRSN”-一种表示默认值的分类变量,即预测的因变量。 总体而
1