吉布斯采样matlab代码-Latent-Dirichlet-Allocation-LDA-:使用折叠的吉布斯采样执行贝叶斯推断

上传者: 38674569 | 上传时间: 2021-11-24 19:45:37 | 文件大小: 683KB | 文件类型: -
吉布斯采样matlab代码Latent-Dirichlet-Allocation-LDA-(MATLAB中的代码) 自然语言处理算法 概率生成模型 Latent Dirichlet Allocation根据主题比例和单词比例对文档进行分类的方法 贝叶斯推断使用折叠的吉布斯采样 与传统的吉布斯采样器相比,收敛速度更快,错误率低 参考文献:托马斯·格里菲斯(Thomas L. Griffiths)和马克·史蒂佛斯(Mark Steyvers)发现科学课题(2004) 这里考虑的词汇大小为16,并使用4x4图像表示。 图像中的每个像素代表词汇表中的一个单词。 像素越亮,在文档/主题中的频率越高。 下图显示了8个主题作为单词分布的基本事实。 现在,使用这些主题生成了500个长度为100的文档。 图像下方显示了生成的文档示例。 现在,在这些生成的文档上运行了LDA(超过500次迭代),并发现了主题。 下面的屏幕快照显示了在初始迭代和最终迭代中发现的主题。 Theta地面真相值 范例文件 初始Phi迭代 最终Phi迭代 经过最终的迭代,发现的主题为: 它包含以下功能: 1)代码LDA Matlab

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明