Python中的轨迹分析和分类(Pandas和Scikit Learn) 一项针对数据挖掘研究生课程的大学项目。 给我们一个trainset,其中地理点与时间间隔成对。 首先,我们清理数据集,然后形成轨迹(具有相应的路线ID)。 本部分的最后一步是根据_their的total_distance和最大距离(它们的两个点之间)过滤掉一些轨迹。 该项目的目标首先是计算test_set_a1 / a2.csv和train_set.csv的轨迹之间的轨迹相似度。 用于该算法的算法是: 快速动态时间规整(Fast-DTW) ,取自 我实现的最长公共子序列算法。 每次考虑的距离是点的Haver
2022-04-13 21:36:53 24.33MB python machine-learning random-forest dtw
1
sentiment_analysis:亚马逊手机评论的情感分析
1
dec-tree-random-forest-泰坦尼克号 使用决策树和随机森林模型预测泰坦尼克号乘客的存活率。 使用熊猫和 scikit-learn。 数据及比赛详情:
2022-03-16 10:07:41 36KB Python
1
带有CSE-CIC-IDS-2018的指令检测系统 这是针对CIC-IDS-2018的具有随机森林算法的机器学习分析。 它仅使用“ Thursday-15-02-2018_TrafficForML_CICFlowMeter.csv”文件来分析DDoS攻击。 我将模型应用于通过Django和Django-Channels来利用sFlow的软件定义网络中的DDoS攻击。 在这里了解更多: : 信用:
2022-03-12 18:33:53 12KB data-science machine-learning ddos random-forest
1
结合随机森林和LSBoost进行证券市场指数预测。 Abstract— This research work emphases on the prediction of future stock market index values based on historical data. The experimental evaluation is based on historical data of 10 years of two indices, namely, CNX Nifty and S&P Bombay Stock Exchange (BSE) Sensex from Indian stock markets. The predictions are made for 1–10, 15, 30, and 40 days in advance. This work proposes to combine the predictions/estimates of the ensemble of trees in a Random Forest using LSboost (i.e. LS-RF). The prediction performance of the proposed model is compared with that of well-known Support Vector Regression. Technical indicators are selected as inputs to each of the prediction models. The closing value of the stock price is the predicted variable. Results show that the proposed scheme outperforms Support Vector Regression and can be applied successfully for building predictive models for stock prices prediction.
2022-01-09 19:27:53 255KB 机器学习 随机森林
1
随机森林回归 森林随机回归
2021-12-21 17:16:24 2KB Python
1
EDA和ML项目 存储库包含各种项目,这些项目都使用R语言编写了以下代码: 探索性数据分析 机器学习模型(线性回归,逻辑回归,k均值聚类,分层聚类,SVM,决策树,随机森林,时间序列分析,XGBoost) 以下是一些常用的程序包/库的列表,这些程序包/库被用作数据分析和构建机器学习模型的一部分 数据处理: dplyr,plyr,tidyr,stringer,data.table,lubridate(用于日期处理), 数据可视化: ggplot2,cowplot,ggthemes,比例 ML模型: randomForest,caret(用于数据拆分,交叉验证,预处理,特征选择,变量重要性估计等) 推荐模型: re荐 文本挖掘: tm,tidyverse
2021-12-17 12:54:13 26.84MB r random-forest clustering linear-regression
1
机器学习的作者身份归属 具有随机森林和TFIDF分数的作者身份归因 该存储库包含博客文章《 代码。 它使用随机森林模型以及TFIDF分数作为特征,在n个作者之间执行作者身份分类。 文件说明 路径 描述 作者属性 主文件夹。 └sample_data 包含作者数据的文件夹。 ├authors_folders 每个作者一个文件夹。 ├authors_article_0.txt 作者的第一篇文章。 ├authors_article_1.txt 第二篇。 ├... authors_article_n.txt ...上一篇文章。 ├attribution_model.py 作者
1
GDP_and_Employment_Rates_Prediction:一种机器学习回归模型,使用Python中的随机森林回归来预测国家的GDP和就业率
2021-12-14 20:32:48 125KB machine-learning random-forest numpy scikit-learn
1
太阳能预报 该项目是我最后一个学期的硕士学位课程工作的一部分。 此处的主要范围和目标是预测来自亚洲地理位置的年度太阳能发电量(取决于数据),然后减少产生的总软成本。 下文提供的文档和项目报告中详细介绍了这项工作。
2021-11-24 13:14:47 1.42MB aws neural-network random-forest sklearn
1