本文讨论了使用机器学习进行恶意软件分类的方法,问题和解决方案。 可以相信,被释放的恶意软件的数量可能会超过权威软件的释放。 由于恶意软件每年都会变得越来越复杂,因此需要从传统方法转变为使系统自动学习。 这里的主要重点是研究机器学习方法以及它们的检测和分类问题。 说明了特征选择和高假阳性问题,并提出了解决方案。 然后将操作码,n-gram操作码,基于图像的分类技术进行比较。 这些方法将有助于清除恶意软件并将其分类到其家族中。 与常规操作码和基于图像的分类器相比,使用n-gram操作码分类时基于准确性的结果更好,但是使用集成方法结合了这两种方法的优点,例如,过拟合和FPR较低,最终结果显示出分类精度更高和提供总体上更好的恶意软件分类。
2021-10-30 22:03:57 1.01MB Machine Learning Malware Detection
1
统计技术的创新引发了对跨种族和性别等类别的分布影响的担忧。 从理论上讲,随着统计技术的进步,分布结果取决于函数形式的变化如何与可观察特征的跨类别分布相互作用。 使用美国抵押贷款的详细管理数据,我们将传统 logit 和更复杂的机器学习违约预测模型的预测嵌入到一个简单的均衡信用模型中。 机器学习模型总体上略微增加了信贷供应,但增加了组间和组内的比率差异; 影响主要来自揭示默认值和可观察值之间结构关系的灵活性,而不是来自排除特征的三角测量。 我们预测黑人和西班牙裔借款人从新技术中获益的可能性要小得多。
2021-10-30 20:52:33 1.23MB machine learning credit
1
新网银行的统计建模比赛,使用xgboost +lr模型融合,先用xgboost提取特征,再使用lr分类。
2021-10-30 15:33:23 6KB machine lear
1
Sentiment_analysis_twitter 总览 分析表情符号在改善情感分析结果中的作用。 使用Twitter StreamAPI收集Twitter数据,并使用TF-IDF对推文进行矢量化处理。 使用矩阵创建一个正向和负向矢量,并使用余弦相似度来确定给定推文为正或负的程度。 通过转换unicode将Emoji表情合并到推文中,并重复该过程。 将过程分类提高了15%。 动机 了解人类的情感和理智向来是我的痴迷。 借助我的数据科学技能,我想了解人们如何在社交网络上表达情感,也就是情感分析。 作为一个狂热的Twitter用户,我知道限制少于140个字符如何迫使人们进行创新,以及表情符号如何
2021-10-30 10:41:59 34.11MB emoji nlp machine-learning tweets
1
脑电图机器学习挑战 EEG 机器学习挑战赛,Python 和 MATLAB(学者项目,2015) 本次挑战的目标包括根据 30 秒的 EEG 信号确定正确的睡眠阶段(W、R、N1、N2、N3); 数据集分别包含 10178 和 10087 个 EEG 用于训练和测试。 特征提取 首先,我编写了自己的Python脚本(参见: : ),在学校网络上应用分布式并行计算。 它将特征的计算时间除以超过 100。超过 100。 PyEEG / PyREM / MNE 感谢 PyEEG 库,我提取了这些特征: DFA:去趋势波动分析 PFD:Petrosian 分形维数 hjorth:Hjorth 移动性和复杂性 ApEn:近似熵 SampEn:样本熵(SampEn) hfd:樋口分形维数 费舍尔信息:费舍尔信息 SVD:SVD熵 bin power & bin power ratio:由
2021-10-30 10:11:33 78KB Python
1
可教学机器 使用神经网络训练来区分某些对象的WEB页面。
2021-10-30 01:16:24 54KB HTML
1
新的: 想要将可教机器带入您自己的网站创作中吗? 我们正在开发一个名为eachablemachine.js的库,它将使您做到这一点。 这是您可以使用的第一个可混音演示,以窥视一下可能发生的情况: 演示演示如何仅需几行代码就可以在网站顶部放置机器学习“培训向导”。 可教学机器社区 什么是可教学机? 是一个基于Web的工具,可让每个人快速,轻松且易于访问地创建机器学习模型。 。 是给谁用的? 教育者,艺术家,学生,创新者,各种创造者–实际上,任何有想法要探索的人。 不需要先决条件的机器学习知识。 它是如何工作的? 您可以训练计算机来识别图像,声音和姿势,而无需编写任何机器学习代码。 然后,在您自己的项目,站点,应用程序等中使用您的模型。 该存储库是做什么用的? 该存储库包含两个组件: 一个部分,其中包含可教学机器中使用的所有机器学习代码。 在,我们使用 (一个使用Javascr
2021-10-30 01:05:42 6.62MB TypeScript
1
狗AI :light_bulb: 项目 使用Tensorflow.js和Teachable Machine通过拖放图像来识别100多种狗品种。 训练过程 收集带有一堆图像的数据集 调整大小并缩小所有图像 按品种分开狗图像并重命名所有文件 上载到可教机器 训练模型 导出训练有素的模型 :hammer_and_wrench: 工具 :laptop: 演示版 :rocket: 快速开始 安装 克隆存储库并运行 $ cd dogAI && yarn 用法 $ yarn start 数据集参考 小学:Aditya Khosla,Nityananda Jayadevaprakash,Bangpeng Yao和Li Fei-Fei。 用于细粒度图像分类的新型数据集。 首届细粒度视觉分类(FGVC)研讨会,IEEE计算机视觉和模式识别会议(CVPR),2011年。 中学:J. Deng,W. Dong,R. Socher,L.-J。 Li,K. Li和L. Fei-Fei,Im
2021-10-30 00:57:05 12.95MB react reactjs tensorflow tensorflowjs
1
美国运输模式 US-Transporation是我们数据集的名称,其中包含来自13个以上用户的传感器数据。 鉴于文献中缺乏针对TMD的通用基准,我们通过一个简单的Android应用程序收集了一大套属于不同主题的度量。 我们公开发布数据集,以便其他研究人员可以从中受益,以进行进一步的改进和提高研究的可重复性。 我们的数据集是由不同性别,年龄和职业的人构建的。 此外,我们不对应用程序的使用施加任何限制,因此,每个用户都记录自己习惯执行该操作的数据,以便评估现实世界的状况。 除了可下载的数据集之外,在此页面中,您还可以找到Python的代码以提取特征,并建立机器学习模型以进行预测。 您可以在找到有关数据集和我们的工作的更多信息。 如果对您的研究有所帮助,请在您的出版物中引用以下论文: @article{carpineti18, Author = {Claudia Carpineti,
1
斯坦福大学吴恩达2014机器学习个人笔记完整版v5.3-A4打印版
2021-10-29 15:23:48 8.11MB Machine Lear
1