毕业设计论文范文源码用于初创投资的机器学习方法 完整数据集可从: 抽象的 在这个项目中,实施和探索了一种将初创公司分为两类(成功和不成功)的机器学习方法。 该项目的数据集是从 Crunchbase 获得的。 它由 11 个不同的表格组成,其中包含有关初创公司、投资者、关系和创始人在生态系统中的背景以及许多其他信息的信息。 四个表被列入候选名单并合并为一个数据集。 然而,在数据转换和预处理之后,由于数据稀疏,不得不丢弃大量数据。 最终数据集由 61,716 个初创公司实例和 36 个特征组成。 还进行了特征缩放,将特征数量减少到七个,同时保持相同的预测能力。 对数据使用了五种监督机器学习算法,其中包括:决策树、支持向量机、随机森林、朴素贝叶斯和多层感知器。 K-means Clustering 也被组合应用,用于提升性能。 所有机器学习算法的准确率都达到了 90% 以上。 然而,这可以归因于数据集上存在的类的偏态分布。 召回被认为是一个更重要的绩效指标,因为应该优先考虑最大限度地减少误报(将任何成功的启动错误归类为不成功)的策略(错失机会的成本非常高)。 结果表明,MLP 模型在所有其他
2021-09-28 21:59:39 16.05MB 系统开源
1
This graduate-level textbook introduces fundamental concepts and methods in machine learning. It describes several important modern algorithms, provides the theoretical underpinnings of these algorithms, and illustrates key aspects for their application. The authors aim to present novel theoretical tools and concepts while giving concise proofs even for relatively advanced topics. Foundations of Machine Learning fills the need for a general textbook that also offers theoretical details and an emphasis on proofs. Certain topics that are often treated with insufficient attention are discussed in more detail here; for example, entire chapters are devoted to regression, multi-class classification, and ranking. The first three chapters lay the theoretical foundation for what follows, but each remaining chapter is mostly self-contained. The appendix offers a concise probability review, a short introduction to convex optimization, tools for concentration bounds, and several basic properties of matrices and norms used in the book. The book is intended for graduate students and researchers in machine learning, statistics, and related areas; it can be used either as a textbook or as a reference text for a research seminar.
2021-09-28 21:49:46 3.39MB Book
1
南京大学机器学习导论课程PPT,包括概论、模型评估、线性分类器、决策树、神经网络、贝叶斯学习等
2021-09-28 17:51:22 26.69MB machine learning
1
使用监督学习的股市价格预测 目标 检查许多不同的预测技术,以根据过去的收益和数字新闻指标预测未来的股票收益,以构建多只股票的投资组合,以分散风险。 为此,我们通过解释看似混乱的市场数据,将监督学习方法应用于股价预测。 设定说明 $ workon myvirtualenv [Optional] $ pip install -r requirements.txt $ python scripts/Algorithms/regression_models.py <input-dir> 从下载运行代码所需的数据集。 项目概念视频 方法 预处理和清洁 特征提取 Twitter的情绪分析和得分 数据归一化 各种监督学习方法的分析 结论 研究论文 使用的数据集 有用的链接 幻灯片: : 视频: : 报告: : 参考文献
2021-09-27 21:49:36 7.33MB machine-learning video analysis lstm
1
TensorFlow 2.0教程 我们的回购。 是的赢家 。 时间线: 2019年10月1日:TensorFlow 2.0稳定! 2019年8月24日: 2019年6月8日: 2019年3月7日: 2019年1月11日: 2018年8月14日: 安装 确保您使用的是python3.x。 CPU安装 pip install tensorflow - U GPU安装 自己安装CUDA 10.0 (或cudnn )和cudnn 。 并设置LD_LIBRARY_PATH 。 pip install tensorflow - gpu - U 测试安装: In [ 2 ]: import tensorflow as tf In [ 3 ]: tf . __version__ Out [ 3 ]: '2.0.0' In [ 4 ]: tf . test . is_gpu_available () ... totalMemory : 3.95 GiB freeMemory : 3.00 GiB ... Out [ 4 ]: True 配套TF2视频教程 TensorFl
1
FAST算法原作者在2010年提出的改进算法FAST-ER,提高角点检测的重复率。这里是英文原文。我的博客里有FAST-ER的详解,欢迎相互交流>_<
2021-09-27 20:49:55 2.93MB fast 角点检测 FAST-ER
1
机器学习项目 我所有有关机器学习的实践项目的集合 乳腺癌数据集:支持向量机 脊柱后凸数据集:决策树和随机森林 贷款数据集:决策树和随机森林 泰坦尼克号数据集:逻辑回归 葡萄酒质量数据集:决策树和随机森林 波士顿数据集:线性回归 虹膜数据集:支持向量机
2021-09-27 18:26:32 4.55MB JupyterNotebook
1
从症状预测疾病 该项目探索使用机器学习算法来根据症状预测疾病。 探索的算法 在代码中探索了以下算法: 朴素贝叶斯 决策树 随机森林 梯度提升 数据集 源1 与main.py脚本一起使用的此问题的数据集是从此处下载的: https://www.kaggle.com/kaushil268/disease-prediction-using-machine-learning 该数据集共有133列,其中132例是患者经历的症状,以及该患者预后的最后一列。 源2 从此处下载用于Jupyter笔记本的此问题的数据集: https://impact.dbmi.columbia.edu/~friedma/Projects/DiseaseSymptomKB/index.html 该数据集包含3列: Disease | Count of Disease Occurrence | Symptom 您可以将整个表格从此处复制粘贴到excel工作表中,也可以使用Beautifulsoup将其刮下。 目录结构 |_ dataset/ |_ training_data.csv
2021-09-27 15:02:33 3.58MB machine-learning scikit-learn pandas python3
1
DBSCAN1D dbscan1d是一维实现。 创建它是为了在大型1D阵列上高效地执行聚类。 没有一维的特殊情况,因为在这种情况下计算全距离矩阵是浪费的。 最好简单地对输入数组进行排序并执行有效的二等分以找到最接近的点要好得多。 这是运行软件包附带的简单配置文件脚本的结果。 在每种情况下,DBSCAN1D都比scikit Learn的实现快得多。 安装 只需使用pip安装dbscan1d: pip install dbscan1d 它只需要numpy。 快速开始 dbscan1d设计为在几乎所有情况下都可以与sklearn的实现互换。 唯一的例外是weights参数尚不支持。 from sklearn . datasets import make_blobs from dbscan1d . core import DBSCAN1D # make blobs to test clu
1
A-stock-prediction-algorithm-based-on-machine-learning (陆续更新)重新整理过的基于机器学习的股票价格预测算法,里面包含了基本的回测系统以及各种不同的机器学习算法的股票价格预测,包含:LSTM算法、Prophet算法、AutoARIMA、朴素贝叶斯、SVM等 强烈推荐大家去看看sklearn库的文档,地址:[ ] 2021-2-6 出现紧急问题,重新发布 12-3 股票消息面分析 给出一个基于nlp情感分析的消息面分析算法。从新浪财经上获取新闻个股预测情况,使用jieba进行切词和使用snownlp进行情感分析,进行回测。 11-27 修正机器学习算法/DecisionTree.py RandomForest.py 上面的逻辑错误。 11-25 visualization/mlpredict-line.py echarts+tushar
2021-09-27 09:06:31 1.18MB python svm sklearn prophet
1