前面介绍的这些向量化字符串操作方法非常适合用来处理现实中那些凌乱的数据。下面将通过一个从不同网站获取的公开食谱数据库的案例来进行演示。我们的目标是将这些食谱数据解析为食材列表,这样就可以根据现有的食材快速找到食谱。 获取数据:https://github.com/fictivekin/openrecipes 由于书中提供的下载链接已失效,经过本人多方找寻,附上由作者之一最新提供的食谱数据文件。 数据下载(浏览器打开,右键另存为):https://s3.amazonaws.com/openrecipes/20170107-061401-recipeitems.json.gz
2022-08-21 17:01:46 135.13MB python 数据库 开发语言 database
1
菜谱图片地址:https://pan.baidu.com/s/1ptvDHa5-wJdseDpQLKT7Wg 提取码:l03i 菜谱mysl数据包,分三个表 catalog 目录表 dishes 菜谱表 link 目录关联菜谱表
2021-08-25 11:10:15 52.48MB 食谱 菜谱 数据库 mysql
5万的食谱菜谱数据(csv格式),数据来源于公开网络,为了方便数据处理,使用了#符号作为数据处理依据(可以利用这个特征分割符号处理成数组数据),例如:材料、分量,步骤文字和图片两个字段,入库处理的时候可以处理成数组形式(php可以使用explode()函数),方便前端输出。采集数据,尽量过滤了原始无关的html标签。
2019-12-21 22:22:29 28.52MB 食谱数据 菜谱数据 excel数据
1