整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
2023-11-24 21:13:33 33.86MB 自然语言处理 新闻分类语料
1
中文新闻分类数据集
2022-11-02 02:12:57 164KB 中文新闻分类数据集
1
基于贝叶斯新闻分类任务识别系统的设计与实现代码大全.pdf基于贝叶斯新闻分类任务识别系统的设计与实现代码大全.pdf基于贝叶斯新闻分类任务识别系统的设计与实现代码大全.pdf
1
路透社数据集 数据集 新闻分类
2022-07-06 16:06:44 2.22MB 数据集 机器学习 深度学习
1
新闻分类reuters数据集 包含:reuters.npz、reuters_word_index.json
2022-06-07 18:10:05 2.22MB 分类 文档资料 数据挖掘 人工智能
1
新闻分类keras代码reuters.ipynb
2022-06-07 18:10:05 156KB 分类 keras 文档资料 数据挖掘
1
新闻分类reuters.npz 数据集
2022-06-06 14:12:39 2.01MB 分类 文档资料 数据挖掘 人工智能
1
使用sklearn库实现朴素贝叶斯算法。使用词向量算法对文本数据进行处理。 资源内容包括: 1、完整的用于实现新闻分类任务的源码文件(ipynb格式) 2、哈工大停用词表 3、四川大学机器智能实验室停用词表 4、用于测试的新闻数据 贝叶斯定理由英国数学家贝叶斯(Thomas Bayes 1702-1761)发展 用来描述两个条件概率之间的关系 在B条件下A发生的概率: P(A∣B)=P(AB)/P(B) 在A条件下B发生的概率: P(B∣A)=P(AB)/P(A) 则:P(A∣B)P(B) = P(B∣A)P(A) 可导出:P(A∣B)=P(B∣A)P(A)/P(B) 或 P(A∣B) P(B) = P(B∣A)P(A) 贝叶斯公式: P(Y|X)=P(X|Y)P(Y) / P(X) 在机器学习中: X:代表特征向量 Y:代表类别 P(X):先验概率,是指根据以往经验和分析得到的概率。 P(Y|X):后验概率,事情已经发生,这件事情发生的原因是由某个因素引起的可能性的大小 P(X|Y):条件概率,在已知某类别的特征空间中,出现特征值X的概率
2022-05-11 17:06:15 9.82MB 算法 分类 人工智能 机器学习
1.training sets与validation sets,validation sets有何作用, training sets是训练时用来调整权重使用的 validation sets不是用来调整权重用的,而是用作防止过拟合。也就是说当training sets随着训练次数增加,训练准确度也在增加,而经过 validation sets计算后,若精度保持不变或精度没有增加反而减小了,说明发生了过拟合,应当停止训练。 2.为何validation loss总大于training loss,而validation accuracy总小于training accuracy? 参考一些文章后,得知在一般情况下validation loss>training loss,validation accuracy
2022-05-04 22:36:35 1.44MB 深度学习 神经网络 新闻分类
1
针对目前网络热点新闻话题中存在的难以区分一个话题下的多个子话题现象,提出一种基于LDA 模型的子话题划分方法. 首先应用LDA 模型对新闻文档进行建模,采用贝叶斯标准方法确定最优主题个数,使LDA 模型拟合文档性能达到最佳
2022-04-19 12:01:59 433KB LDA 新闻分类
1