校园生活的智能化需要基于各种数据源的自动化处理与分析,这些数据源可能来自传统的传感终端(即典型的传感器)或智能设备,这意味着校园内某些可能的应用实现依赖于机器学习的相关知识。因此,请以“校园里的机器学习”为主题完成你的综述论文。 请利用课程中学到的知识,面向医疗保健领域设计一个数据驱动的机器学习系统。
2022-12-15 20:28:56 30KB 机器学习
1
基于机器学习,利用常用异常检测算法(Isolation Forest、CBLOF、KNN)对数据集中的异常数据进行识别及检测。 孤立森林(Isolation Forest)于2008年由西瓜书作者周志华团队提出,凭借其线性的时间复杂度与优秀的准确率被广泛应用于工业界中结构化数据的异常检测。
2022-12-15 10:27:21 216KB 机器学习 异常检测
1
本资源使用KNN算法对水果特征数据(包括大小、颜色、甜度等等)进行分析,最终实现对水果进行分类的能力。资源包括KNN算法分析源码及水果特征数据(.txt格式),对初学者学习KNN算法具有很强参考和借鉴作用。 KNN(K- Nearest Neighbor)法即K最邻近法,最初由 Cover和Hart于1968年提出,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路非常简单直观:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别 [2] 。 该方法的不足之处是计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最邻近点。目前常用的解决方法是事先对已知样本点进行剪辑,事先去除对分类作用不大的样本。另外还有一种 Reverse KNN法,它能降低KNN算法的计算复杂度,提高分类的效率。
2022-12-15 09:28:47 343KB KNN python 机器学习
1
WebShell是网络入侵的常用工具,具有威害性大、隐蔽性好等特点。目前的检测手段较简单,容易被绕过,难以对付复杂灵活的 WebShell。针对这些问题,提出一种智能检测 WebShell 的机器学习算法,通过对已知存在WebShell和不存在WebShell的页面进行特征学习,完成对未知页面的预测,灵活性、适应性较好。实验证明,相比传统的WebShell检测方法,该算法的检测效率、正确率更高,同时也能以一定概率检测出新型的WebShell。
2022-12-14 21:37:36 670KB WebShell检测 矩阵分解 特征训练
1
机器学习 深度学习 人工智能代码(python)用SVM实现人脸识别 附带结果
2022-12-14 21:05:41 290KB python 支持向量机 人工智能 机器学习
1
Kaggle竞赛解决方案-使用LightGBM算法预测二手商品的成交概率 avito是一家俄罗斯公司,从网站上来看是一个线上购物平台,这一次题目的目标,就是预测某一个商品在某一天被售出的概率,给定的数据有一段时间内的商品的销售情况(数量,价格,地区,品类,商品的俄文描述,商品的图片)等信息。 Avito提供了多个数据集, 除了主要的训练集(train.csv, 150万+样本)和测试集(test.csv, 50万+样本)外, 还有train_active.csv/test_active.csv(和train/test同时期的数据, 但没有成交概率和图片信息); periods_train.csv/periods_test.csv(只包含了active数据中每件商品的id, activation_date - 广告投放日期, date_from/date_to - 广告展示的第一天和最后一天); train_jpg.zip/test_jpg.zip(train和test样本的图片)。
2022-12-14 20:27:02 298KB python lightGBM 机器学习
1
AI Conference 北京站 AI Conference 2019 北京站6月18-21日即将开幕! 培训:大会推出「PyTorch 深度学习」两天培训课程,资深数据科学家主讲,限制人数,抢票从速! 编者注:文中超链接如果不能访问可以点击“阅读原文”访问本文原页面;查看2019年6月18日至21日在北京举行的人工智能大会上的相关议题。 开源NLP库 在开发和生产中,最受欢迎的NLP库列表如下: Spark NLP spaCy NLTK OpenNLP Stanford CoreNLP 显然,NLP领域还有更多的库。但是,这些库更通用,涵盖更多功能,而不只是专注于特定用例。例如,gen
2022-12-14 19:40:48 185KB nlp 机器学习 自然语言
1
THUNEWS数据集,摘取了五个主题,分别为1.娱乐 2.房产 3.体育 4.股票 5.科技 训练集1 每个主题100个数据 一共500个 训练集2 每个主题1000个数据 一共5000个 训练集2 每个主题10000个数据 一共50000个 测试集 每个主题1000个数据 一共5000个
2022-12-14 17:11:54 92.78MB 数据集 THUNEWS 文本分类 机器学习
1
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:08 24KB 深度学习 机器学习 项目
内含数据集以及算法的源码,适合算法工程师在本领域的练手项目
2022-12-14 16:27:07 96KB 深度学习 机器学习 项目