:incoming_envelope: 垃圾邮件发送者 :postbox: 垃圾邮件检测器 概要 文本挖掘是一个广阔的领域,随着生成的大量文本数据而越来越受欢迎。 使用机器学习模型已经完成了一些应用程序的自动化,例如情感分析,文档分类,主题分类,文本摘要和机器翻译。 垃圾邮件过滤是文档分类任务的一个示例,该任务涉及将电子邮件分类为垃圾邮件或非垃圾邮件(又名火腿)。 在这个项目中,我将以使用Python和可公开获得的邮件语料库的教程的形式,介绍如何实现这种系统的不同步骤。 输出将是一个API和一个Web应用程序,允许用户输入消息并获得响应(如果是垃圾邮件或火腿)。 数据源 安然电子邮件数据集 链接: : Python库 对于Fla
2022-05-10 22:47:54 42.02MB python flask data-science scikit-learn
1
电影_推荐系统 该项目存储库基于构建电影推荐系统克隆 数据集详细信息: 提及用于构建此推荐引擎的数据集如下: 使用的数据集: MovieLens数据集 下载数据集:从以下链接下载数据集 下载Kaggle上托管的MovieLens数据集,然后使用 从其官方网站下载MovieLens数据集,然后使用 数据集文件格式: CSV文件(以逗号分隔的值)。 注意:将数据集下载并保存在input_data文件夹中 数据集类型: 完整的数据集:该数据集包含26,000,000个评分和270,000个用户将750,000个标签应用程序应用于45,000部电影。 包括在1,100个标签中具有1200万相关分数的标签基因组数据。 注意:我们将使用完整数据集为电影建立一个简单的建议。 小型数据集:该数据集包含100,000个评分和1,700个标签应用程序,这些应用程序由700位用户应用于9,000部电影。
1
关于DREAM.3D DREAM.3D是一个开源,跨平台和模块化的软件包,允许用户重建,实例化,量化,网格化,处理和可视化多维,多模式数据。 DREAM.3D建立在SIMPL和SIMPLView软件项目之上,并且包含一个过滤套件,供材料科学家使用,以用于重建3D微结构或合成生成微结构。 核心软件包具有许多主要功能,包括: Windows / MacOS / Linux的预编译二进制文件 请从下载适合您平台的预编译二进制文件 一般特征 超过350个过滤器来处理数据 导入/导出CSV,文本和二进制数据 导入/导出OEM EBSD数据(.ang,.ctf,.h5) 导入和导出灰度和彩色图像(TIFF,PNG,JPEG,BMP等) 导出STL文件 从HDF5文件导入数据 将文件保存为HDF5文件 使用许多不同的过滤器处理数据 计算许多微观结构统计信息(晶粒尺寸,平均取向等) 生成许多​​类
2022-05-06 23:24:26 32.16MB c-plus-plus data-science analysis filter
1
Data Science Foundations.pdf
2022-05-02 14:05:59 6.65MB 源码软件
Data science from scratch
2022-04-27 00:15:04 5.02MB data science
1
BIGUQ.jl:贝叶斯信息鸿沟决策理论
1
///// 快书 这些笔记本介绍了深度学习, 和 。 fastai是用于深度学习的分层API; 有关更多信息,请参见。 此回购协议中的所有内容均受版权保护,由Jeremy Howard和Sylvain Gugger于2020年开始。 这些笔记本用于 ,构成了 的基础,目前可以购买。 它没有与该草案相同的GPL限制。 GPL v3许可证涵盖了笔记本和python .py文件中的代码; 有关详细信息,请参见LICENSE文件。 其余部分(包括笔记本和其他散文中的所有降价单元)均未经许可可用于任何重新分发或更改格式或媒介的行为,除了复制笔记本或为您自己的私人使用而分叉此存储库外。 禁止用于商业
2022-04-13 09:41:30 41.89MB python data-science machine-learning deep-learning
1
使用卫生保健数据预测抑郁 作者:Vivienne DiFrancesco 可以在找到用于探索该项目中使用的数据的配套仪表板 该存储库的内容是对使用机器学习模型来预测使用医疗保健数据的人的抑郁症的分析。 希望可以使工作更易于访问和复制,从而进行详细的分析。 储存库结构 README.md:此项目审阅者的顶级自述文件 first_notebook.ipynb:从数据清理阶段开始在jupyter笔记本中进行分析的叙述性文档 second_notebook.ipynb:在项目的探索阶段清理数据之后开始的叙述性文档的延续 PredictingDepressionSlides.pdf:项目演示幻灯片的PDF版本 project_functions文件夹:包含编写用于first_notebook和second_notebook的自定义函数 仪表板文件夹:包含用于创建此项目的配套仪表板的文件的文件夹 抽
2022-04-11 19:56:07 71.88MB data-science python3 healthcare machinelearning
1
R语言对数据进行分析,包含代码和书籍。。。。。。。。
2022-04-03 14:47:52 57.03MB R, Data Science
1
击键动力学的生物特征预测 该项目着眼于具有击键动力学的生物特征识别器。 除了输入密码来验证用户外,还可以通过他们的输入节奏来区分用户。 此功能可用于检测冒名顶替者。 该项目基于出版物Killinghy,KS和Maxion,RA的数据集,该数据集 在过程中。 的Conf。 关于可靠的系统和网络(DSN)(第125-134页) 。 目的是使用库在神经网络上建立分类基础。 包含51个主题,每个主题键入密码.tie5Roanl 400次。 收集的量度是保持时间(H),按键按下时间(DD)和按键按下时间(UD)。 执照 该项目已获得MIT许可。 有关详细信息,请参阅
2022-03-23 15:18:36 15.06MB python data-science sklearn keras
1