餐厅推荐系统 进行评级需要考虑多个因素:等待时间,服务,食物质量,清洁度甚至气氛-例如,一家餐馆对食物的态度可能是积极的,而对服务的态度是消极的。 为了解决这个问题,我们的目标是要包括可以在评论文本中找到的情感,并将其转化为可用于进一步改善对用户的业务建议的数据。 该存储库是一个推荐系统,主要关注通过TF-IDF(术语频率-反文档频率)进行的文本评论分析以及使用AutoPhrase进行的目标情感分析,以将情感附加到餐厅的各个方面。 在构建推荐系统时,我们了解到,评论文本与数字统计数据具有相同的重要性,因为它们包含表征他们对评论的感觉的关键短语。 最终目标是设计一个用于部署我们的推荐系统并显示其功能的网站。 请访问我们的website分支,以对预处理的拉斯维加斯/凤凰城数据集进行一些查询! 重要的事情: 该存储库包含两个分支。 main分支包含我们方法的源代码。 website分支包含
2021-12-13 20:54:26 2.95MB JupyterNotebook
1
MNIST和USPS手写数字识别算法: 朴素贝叶斯和随机森林 bayes-mnist : 多项式朴素贝叶斯和伯努利朴素贝叶斯解决MNIST数据集 bayes-usps : 多项式朴素贝叶斯和伯努利朴素贝叶斯解决USPS数据集 random-forest-mnist : 随机森林解决MNIST数据集 random-forest-usps : 随机森林解决USPS数据集
2021-12-13 19:08:03 23.05MB mnist bayes JupyterNotebook
1
Python课程 欢迎来到此Python课程。 该“存储库”包含一组.ipynb文件(可通过Jupyter Notebook / Lab或直接通过github读取),以及图像和其他文件,旨在为从未进行过编程的人们学习Python语言。 请毫不犹豫地向我提出改进建议,并纠正可能出现的任何错误和错别字。 该作品是根据,这意味着您可以根据需要重复使用,修改和共享该作品,但是您需要确认作者,并以相同的许可重新分享您的作品,而不是商业使用它。 未经事先许可,本课程中包含的所有图像均已获许可复制。 除非另有说明,否则所有内容均取自Wikipedia(或wikimedia)。 级别1-编程基础知识和Python语言基础知识
2021-12-13 18:41:49 906KB python JupyterNotebook
1
ML带回家挑战 通过复制用Python编写的最佳答案来练习带回家的挑战问题
2021-12-13 15:30:45 2.62MB JupyterNotebook
1
GAN生成面: Udacity深度学习纳米学位 使用GAN(生成对抗网络)生成新的面Kong图像。 如何运行: 安装点子 在命令行中通过pip安装jupyter笔记本:“ pip3 install jupyter” 克隆此仓库 进入终端中的这个仓库 在终端中运行“ jupyter笔记本”
2021-12-13 14:50:50 1.99MB JupyterNotebook
1
lda2vec Moody的lda2vec的pytorch实现,这是一种使用词嵌入的主题建模方法。 原始论文: 。 警告:我个人认为使lda2vec算法起作用非常困难。 有时它找到几个主题,有时却找不到。 通常,找到的很多话题都是一团糟。 该算法易于产生较差的局部最小值。 它在很大程度上取决于初始主题分配的值。 对于我的结果,请参阅20newsgroups/explore_trained_model.ipynb 。 另请参见下面的实现详细信息。 失利 培训进行如下。 首先,将文档语料库转换为一组元组{(document id, word, the window around the word) | for each word in the corpus} {(document id, word, the window around the word) | for each word
2021-12-13 14:45:07 1.68MB pytorch topic-modeling word-vectors JupyterNotebook
1
霍克斯 一个用于Hawkes流程的仿真和推断(最大似然估计)的python程序包。 安装 pip install hawkes 教程 特征 该软件包提供以下内核功能: 指数函数 多个指数函数的总和 幂律函数 非参数函数 该软件包提供以下类别的基线强度: 恒定基线 分段恒定基线模型 分段线性基线模型 对数线性基线模型 自定义基线功能 接触 近江孝宏 takahiro.omi.em [at] gmail.com
2021-12-13 14:44:02 976KB JupyterNotebook
1
Kaggle_Projects:在这里,我将存储在Kaggle上完成的所有项目
2021-12-13 13:11:12 22.75MB JupyterNotebook
1
社会距离检测 作者:Gabriel Deza,Danial Hasan,Mengyu Yang(CSC420团队GDM) 社交距离检测管道,可从固定的摄像机镜头自动检测社交距离违例。 我们的方法考虑到了“社会泡沫”,其中由家庭,夫妇等组成的群体未被归类为侵犯行为。 数据集 购物中心和市中心数据集: : usp UCSD行人数据集: : LSTN复旦-上海科技数据集: : 存储库中包括UCSD和LSTN数据集,但提供了链接以供参考。 牛津镇中心数据集太大,因此必须下载。 用法 完整的管道包括以下步骤: 1.目标检测此步骤包括使用对象检测模型从原始摄像机镜头中检测人。 此步骤的输出是每个帧中每个检测到的人周围的边界框。 2.跟踪(中心或光流) 一旦在视频的每个帧中检测到人,我们就会应用算法来跟踪每个唯一的人在连续帧之间的运动。 3.分组现在我们知道了每个人在整个视频
2021-12-13 10:56:08 90.72MB JupyterNotebook
1
灾难鸣叫检测器 项目概况 该项目是Kaggle挑战。 在紧急时刻,Twitter已成为重要的沟通渠道。 由于Twitter提供近乎实时的信息,因此第一响应者越来越多地对其进行监视。 但是他们可能会面临困难,很难清楚地确定一个人是否正在宣布灾难。 使用包含隐喻的许多推文,这项任务可能很棘手。 我基于监督学习构建了一个解决方案,可以识别一条推文是否与真正的灾难有关。 这可以帮助紧急服务自动监视Twitter,以更好地检测灾难。 Github资料库 该存储库包含3个脚本: eda.y :对“关键字”和“位置”特征的探索性分析,以分析与灾难发生的可能关联。 preprocessing.py :一系列推文清洁和预处理 modelling.py :推文矢量化(TF-IDF)和二进制分类模型(多项朴素贝叶斯) 探索性数据分析 我想弄清楚我们是否可以利用模型中的“位置”和“关键字”列。 关键字分
2021-12-13 10:11:32 2.95MB JupyterNotebook
1