SpamClassifier:python中的垃圾邮件分类器,以检查邮件是否为垃圾邮件
2021-12-09 14:57:04 208KB JupyterNotebook
1
Big_Data_Project-伪造新闻检测 在这个项目中,我们展示了使用机器学习算法进行文本分类。 我们致力于对给定的新闻文章是假的还是真实的进行分类。 数据清理和预处理: 删除了文本中的特殊字符拼写检查了所有文档删除了停用词对文档进行矢量化处理。 向量化 对于矢量化,我们使用了-计数矢量化器,TFIDF矢量化器,哈希矢量化器。 分类 对于分类目的,我们使用了:多项朴素贝叶斯,支持向量机(LinearSVC),PassiveAgressiveClassifier。 我们比较了矢量化器和分类器的性能。 最后,我们使用集成模型来获得更高的精度。 我们使用scikit-learn最大投票分类器
1
编写一个java应用程序。用户从键盘输入一个1-9999之间的数,程序将判断这个数是几位数,并判断这个数是否回文数。回文数是指将数含有的数字逆序排列后得到的数和原数相同,例如12121,4224,6778776等都是回文数。 1)程序具有判断用户的输入是否为合法整数的功能。对非法输入(例如含有字母)要进行处理。 2)要判断输入数的位数,并输出相关信息。 3)要判断是否回文数。
1
假新闻检测系统 提议的系统分为多个阶段,以根据数据挖掘操​​作领域(例如数据收集,数据预处理,特征提取,特征选择和机器学习模型的实现)完全隔离工作,以进行将新闻分类为是非的预测并预测新闻属于预测标签的概率。 实施了许多机器学习模型,并根据准确性,f1得分,准确性和召回率等指标对机器学习模型的性能进行了比较。 评估模型性能的主要决定指标被选为f1得分,其中考虑了精度和召回率之间的折衷。 在对以下机器学习模型(SVM,逻辑回归,朴素贝叶斯和随机森林)进行了训练和调整之后,实施了投票分类器,将上述所有模型组合在一起,形成了一个集成分类器,该分类器使用所有这些分类器来预测标签和分类概率并使用软投票方法做出最终预测。 建议的系统步骤: 数据收集:为了实施和测试所建议的系统,使用了William Yang Wang []的“说谎者,说谎者裤子着火:用于虚假新闻检测的新基准数据集”。 该存储库中
2021-12-08 15:47:24 31.54MB 系统开源
1
判断blob字段是否为空sql,非常实用
2021-12-08 10:19:39 44B blob
1
正则检查当前字符串中的字是否包含在GBK字库中,可获取非GBK字符。
2021-12-08 10:01:35 20KB javascript 判断 编码 GBK
1
关于在FPGA存储AD采样值 利用何种截位方式可以避免带来直流分量给出matlab仿真,并说明原因.zip
2021-12-07 22:17:42 13KB FPGA AD 截位方式
1
批量 ping IP 地址,检测是否丢包 ,运行后要求你输入网址或者IP地址,一行一个,然后程序会自动 Ping,显示出必要的信息。 Ping的运作原理是向目标主机传出一个 ICMP echo要求封包,等待接收echo回应封包。程式会按时间和反应成功的次数,估计失去封包率(丢包率)和封包来回时间(网络时延)。
2021-12-06 17:00:09 61KB 批量ping 检测是否丢包 ip地址
堆叠分类器 堆叠分类器以预测客户是否将退出银行
2021-12-06 16:59:11 260KB JupyterNotebook
1
分类_贷款状态 建立了一个分类器,以预测是否将还清贷款案。 数据集 使用以前贷款申请中的历史数据集,清理数据并在数据上应用不同的分类算法使用以下算法构建模型-k最近邻居决策树支持向量机Logistic回归 分析步骤 数据探索数据清理预处理-特征选择/提取归一化数据分类算法模型评估 结果 当适用这些结果时,将使用以下度量标准将结果报告为每个分类器的准确性:Jaccard索引F1分数LogLoass
2021-12-05 21:36:33 5KB JupyterNotebook
1