yelp_review_full_csv数据集,是Yelp为了学习目的而发布的一个开源数据集。它包含了由数百万用户评论,商业属性这是一个非常常用的全球NLP挑战数据集。训练集总共650,000,测试集50,000,一共5个分类,每一种各有130,000训练样本,10,000个测试样例。
2020-01-03 11:21:36 187.06MB yelp数据集
1
elp希望更多的学生利用这些数据,在研究中想出创新性方法,他们也提供了目前感兴趣的一些主题。 一是图片分类。目前他们虽然能识别出图片中类似于汉堡之类的食物,但是如何评价一张图片是否好看还有待研究。 二是自然语言处理和情感分析。用户评价数据里有很多能挖掘的元数据,可以用于推断语义、商户属性和情感。他们想知道评价里表达了什么,是好评还是差评。 三是图像挖掘。比如说挖掘出用户之间的关系是如何限定他们的使用规律,流行趋势的引导者在一家店火起来之前都是去哪儿吃饭的。
2019-12-21 21:57:14 49B 数据集
1
用于基于地理位置的推荐系统数据集。 After preprocessing, the dataset contains 30,887 users, 18,995 POIs and 860,888 reviews.
2019-12-21 20:15:29 7.8MB Yelp 数据集 推荐系统 POI
1