MCMC算法报告:完成的是《贝叶斯统计》P295页的大作业 MCMC算法PPT: MCMC原理,上课老师的PPT 4个文件夹,每个文件夹,都实现了1种方法,独立使用,且都附有运行结果图。 第1个文件夹: 随机游动txt:主函数 mycumprod.txt:用来计算似然函数 第2个文件夹: MH算法mcmc.txt:主函数 mycumprod.txt:用来计算似然函数 mycalc_density.txt:用来计算二维正态概率密度 mycalc_S.txt:用来计算Fisher信息矩阵 第3个文件夹: MH逐分量算法.txt:主函数 mycumprod.txt:用来计算似然函数 第4个文件夹: 切片Gibbs算法.txt:主函数
1
新浪新闻文本分类 语料库重建 本项目的语料来源新浪新闻网,通过spider.py爬虫模块获得全部语料,总计获得10类新闻文本,每一类新闻文本有10条。 采纳新浪新闻网的一个api获取新闻文本,api的url为 使用进度池并发执行爬虫,加快抓取速度。 数据预处理 本项目的数据预处理包括:分词处理,去噪,向量化,由stopwords.py模块,text2term.py模块,vectorizer.py模块实现。 本项目借助第三方库解霸完成文本的分词处理。 通过停用词表移除中文停用词,通过正则表达式消除数字(中文数字&阿拉伯数字)。 filter_pattern = re . compile ( ur'[-+]?[\w\d]+|零|一|二|三|四|五|六|七|八|九|十|百|千|万|亿' ) 使用进程池并发执行数据的分词和去噪,加快数据预处理的过程。 把数据集1:1划分为训练集和测试集,各50w篇文档。 通过scikit-learn提供的CountVectorizer类完成矢量化,得到训练集和测试集两个文本的特征矩阵,矩阵类型为稀疏矩阵。 移除文档中文档频率小于0.1%的特征,这些特征我们认
2021-05-14 10:13:12 98KB data-mining text-classification svm scikit-learn
1
模式识别相关知识,贝叶斯决策理论
2021-05-13 22:02:25 938KB 模式识别 人工智能
1
MATLAB实现Bayes(贝叶斯)优化LSTM(长短期记忆神经网络)时间序列预测数据集
1
Bayes估计是对产品无失效数据进行分析的一种有效方法. 对无失效数据,给出了失效概率的Bayes 估计,并结合配分布曲线方法和matlab 软件给出了无失效数据时产品寿命分布类型的确定方法
2021-05-07 18:44:13 487KB Bayes 无失效数据 可靠性
1
贝叶斯分类R语言实现代码,带中文分词,准确率召回率判断
2021-04-28 22:37:56 2KB 贝叶斯 bayes 中文 分词
1
这是我用python写的朴素贝页斯分类器(Naive Bayes classifier)
2021-04-25 08:53:47 20KB python 朴素贝页斯
1
基于matlab的小波变换去噪处理三种方法-bayes.m 里面有详细的解释。最后有图像评价,计算均方误差和信噪比。
2021-04-20 15:32:03 267B matlab
1
python实现knn、naive bayes、vsm、tf-idf模型。并包含数据集
2021-04-19 22:12:54 40.90MB python knn naive bayes
1
Coursera NLP课程第二周Assignment
2021-04-17 17:04:37 10KB NLP python Coursera
1