使用机器学习识别欺诈(项目概述) 项目目标 在2000年,安然(Enron)是美国最大的公司之一。 到2002年,由于广泛的公司欺诈行为,该公司破产了。 在最终的联邦调查中,大量的通常是机密信息被输入到公共记录中,包括成千上万的电子邮件和高级管理人员的详细财务数据。 这些数据已与手工生成的欺诈案件中感兴趣的人的名单相结合,这意味着被起诉,与政府达成和解或辩诉交易或作证以换取起诉豁免权的个人。 这些数据为146名员工创建了21个要素的数据集。 该项目的范围是创建一种算法,该算法能够识别可能实施欺诈的安然员工。 为了实现此目标,部署了探索性数据分析和机器学习以从异常值中清除数据集,识别新参数并将
1
蒙古BERT型号 该存储库包含由 , 和训练的经过预训练的蒙古模型。 特别感谢提供了5个TPU。 该存储库基于以下开源项目: ,和 。 楷模 词汇量为32000的用作文本标记器。 您可以使用蒙版语言模型笔记本 测试经过预训练的模型可以预测蒙面蒙语单词的效果如何。 BERT-Base: 和 BERT-Large: HuggingFace 未装箱的BERT-Base: TensorFlow检查点和PyTorch模型 未装箱的BERT-Large: HuggingFace 盒装BERT-Base 下载TensorFlow检查点或PyTorch模型。 评估结果: global_step = 4000000 loss = 1.3476765 masked_lm_accuracy = 0.7069192 masked_lm_loss = 1.2822781 next_sentence_a
1
一组用于在可视节点编辑器中统一设计AI的工具。 用于: 行为树。 有限状态机。 实现自己的AI图。 通往v0.2.0的道路 如果您有兴趣在development分支中进行更改,那么我正在更新此存储库。 也可以随时与您有关如何改进这些工具的任何建议不一致。 发生了什么变化? 关注点分离。 仅将xNode用作序列化和行为构建器工具。 不对运行时执行的方式做任何假设。 交互行为而不是字典的黑板。 使用新的复合节点Active Selector和Active Sequencer进行行为树检修。 其他可能的变化 AI行为的标准化版本。 基于实用程序的行为树。 一些样品。 主要特点 行为树
2021-11-19 10:10:32 66KB unity finite-state-machine behaviour-tree xnode
1
matlab +人口增长代码乳腺癌分类器(Logistic回归) 此代码可帮助您使用Logistic回归对恶性和良性肿瘤进行分类 Sourcerer 规范要求 示例代码在Matlab中(或更高版本可以使用)。 您可以安装Conda for python,它可以解析机器学习的所有依赖关系。 描述 Logistic回归是为方法核心使用的函数Logistic函数而命名的。 统计学家开发了逻辑函数,也称为S形函数,用于描述生态中人口增长的特性,该特性Swift增长并在环境的承载能力方面达到最大化。 这是一条S形曲线,可以采用任何实数值并将其映射为0到1之间的一个值,但永远不能精确地位于这些极限值处。 1 /(1 + e ^-值) 想要查询更多的信息, 一些注意事项 数据集-UCI-ML 我仅使用32个功能中的2个进行分类。 工作实例 执行 要运行代码,请输入run breast_cancer.m run breast_cancer.m Python实现 数据集-UCI-ML 我使用了30种功能进行分类 我使用的是1 =良性和2 =恶性,而不是0 =良性和1 =恶性 准确度〜92% 执行 要运行
2021-11-19 09:33:24 21.75MB 系统开源
1
该书是英文版电子书,是机器学习的经典教材,内容清晰全面
2021-11-18 19:44:34 8.08MB 机器学习
1
This book is a comprehensive guide to machine learning with worked examples in MATLAB. It starts with an overview of the history of Artificial Intelligence and automatic control and how the field of machine learning grew from these. It provides descriptions of all major areas in machine learning. The book reviews commercially available packages for machine learning and shows how they fit into the field. The book then shows how MATLAB can be used to solve machine learning problems and how MATLAB graphics can enhance the programmer’s understanding of the results and help users of their software grasp the results. Machine Learning can be very mathematical. The mathematics for each area is introduced in a clear and concise form so that even casual readers can understand the math. Readers from all areas of engineering will see connections to what they know and will learn new technology. The book then provides complete solutions in MATLAB for several important problems in machine learning including face identification, autonomous driving, and data classification. Full source code is provided for all of the examples and applications in the book. What you'll learn An overview of the field of machine learning Commercial and open source packages in MATLAB How to use MATLAB for programming and building machine learning applications MATLAB graphics for machine learning Practical real world examples in MATLAB for major applications of machine learning in big data Who is this book for The primary audiences are engineers and engineering students wanting a comprehensive and practical introduction to machine learning. Table of Contents Part I Introduction to Machine Learning Chapter 1: An Overview of Machine Learning Chapter 2: The History of Autonomous Learning Chapter 3: Software for Machine Learning Part II MATLAB Recipes for Machine Learning Chapter 4: Representation of Data for Machine Learning in MATLAB Chapter 5: MATLAB Graphics: Chapter 6: Machine Learning Examples in
2021-11-18 15:10:34 9.87MB MATLAB Machine Learning
1
蛋白质网 ProteinNet是用于机器学习蛋白质结构的标准化数据集。 它提供蛋白质序列,结构(和),多个序列比对( ),位置特定的评分矩阵( ),以及标准化的拆分。 ProteinNet建立在两年期评估的基础上,该评估对最近解决但尚未公开获得的蛋白质结构进行盲目预测,以提供推动计算方法学前沿的测试集。 它被组织为一系列数据集,涵盖了CASP 7至12(涵盖十年),以提供一系列数据集大小,从而可以在相对数据贫乏和数据丰富的体制中评估新方法。 请注意,这是一个初步版本。 用于构建数据集的原始数据以及MSA尚未普遍可用。 但是,可应要求提供ProteinNet 12的原始MSA数据(4TB)
1
kaggle数据集 可供所有人使用的Kaggle数据集集合 系统 Python 3.5 Python 3.6 Python 3.7 Linux 苹果系统 视窗 有关Kaggle数据集的更多信息 import kaggledatasets as kd heart_disease = kd . structured . HeartDiseaseUCI ( download = True ) # Returns the pandas data frame to be used in Scikit Learn or any other framework df = heart_disease . data_frame () # Returns the tensorflow dataset type compatible with TF 2.0 dataset = heart_disease . load () for batch , label in dataset . take ( 1 ): for key , value in batch . items ():
1
umap:均匀流形逼近和投影
1
Multiple Kernel Extreme Learning Machine
2021-11-17 11:35:49 605KB 研究论文
1