Big_Data_Project-伪造新闻检测 在这个项目中,我们展示了使用机器学习算法进行文本分类。 我们致力于对给定的新闻文章是假的还是真实的进行分类。 数据清理和预处理: 删除了文本中的特殊字符拼写检查了所有文档删除了停用词对文档进行矢量化处理。 向量化 对于矢量化,我们使用了-计数矢量化器,TFIDF矢量化器,哈希矢量化器。 分类 对于分类目的,我们使用了:多项朴素贝叶斯,支持向量机(LinearSVC),PassiveAgressiveClassifier。 我们比较了矢量化器和分类器的性能。 最后,我们使用集成模型来获得更高的精度。 我们使用scikit-learn最大投票分类器
1
根据算法导论上的HashTable, C语言实现
2021-12-07 18:03:35 846B Hash table C
1
设计哈希表实现电话号码查询系统。基本要求: 1、设每个记录有下列数据项:电话号码、用户名、地址; 2、从键盘输入各记录,分别以电话号码和用户名为关键字建立哈希表; 3、采用再哈希法解决冲突; 4、查找并显示给定电话号码的记录; 5、查找并显示给定用户名的记录
2021-12-07 10:43:27 50KB 哈希表
1
自己写的关于哈希表的代码。实现对本班同学的姓名进行哈希排序,查找。还有待完善。。不过能运行带注释好理解。希望给初学者带来帮助
2021-12-05 17:54:30 143KB 数据结构
1
哈希算法md2 c语言编写的源码
2021-12-05 16:14:25 3KB 哈希md2
1
提供了获取哈希值接口、获取哈希算法标识已经使用算法值接口源码,接口都是正式封装的,IDEA编译,输出结果符合官方数据
2021-12-04 09:49:15 25KB java hash digestAlgori
1
哈希表算法PPT,这几天算法课看的,在网上找的一个写的很不错的
2021-12-03 17:56:00 639KB 哈希表算法
1
基本要求: 1、设每个记录有下列数据项:电话号码、用户名、地址; 2、从键盘输入各记录,分别以电话号码和用户名为关键字建立哈希表;3、采用再哈希法解决冲突; 4、查找并显示给定电话号码的记录; 5、查找并显示给定用户名的记录。6、在哈希函数确定的前提下,尝试各种不同类型处理冲突的方法(至少两种),考察平均查找长度的变化。
2021-12-03 14:02:21 7KB 哈希表
1
图像哈希 感知哈希是多媒体文件的指纹,它是从其内容的各种功能派生而来的。 与依赖于输入中的小变化导致输出中的急剧变化的雪崩效应的密码散列函数不同,如果特征相似,则感知散列彼此“接近”。 与诸如MD5和SHA1的加密哈希函数相比,感知哈希是一个不同的概念。 使用加密哈希时,哈希值是随机的。 用于生成哈希的数据的行为类似于随机种子,因此相同的数据将生成相同的结果,但是不同的数据将生成不同的结果。 比较两个SHA1哈希值实际上仅告诉您两件事。 如果哈希不同,则数据也不同。 如果哈希相同,则数据可能相同。 相反,可以比较感知哈希值-使您感觉到两个数据集之间的相似性。 这段代码的启发/基于: 要求 PHP 7.1或更高版本 或扩展 (可选)安装扩展程序,以进行更快的指纹比较 安装 该软件包尚未达到稳定版本,在0.x版本之间可能会向后兼容。 如果您打算在生产中使用此版本,请确保将其锁定!
2021-12-03 11:35:34 13KB image hash image-hash perceptual-hashes
1
哈希表应用C++_STL_hash 哈希表应用C++_STL_hash 哈希表应用C++_STL_hash
2021-12-02 15:51:24 6KB 哈希 hash C++
1