医学stop_words.txt,这个版本适合医学数据的数据,EMR以及相关文献和书籍数据,医学文本stop_words集合;医学stop_words.txt,这个版本适合医学数据的数据,EMR以及相关文献和书籍数据,医学文本stop_words集合;医学stop_words.txt,这个版本适合医学数据的数据,EMR以及相关文献和书籍数据,医学文本stop_words集;医学stop_words.txt,这个版本适合医学数据的数据,EMR以及相关文献和书籍数据,医学文本stop_words集合;医学stop_words.txt,这个版本适合医学数据的数据,EMR以及相关文献和书籍数据,医学文本stop_words集合
1
big5图书推荐 将5大人格特质调查数据集与57k书籍数据集合并,以推荐个性特质组合的良好读物 步骤1:将57,000个书名及其简短说明矢量化(“模糊”) 步骤2:将每个调查参与者的“五种人格特质调查”结果矢量化 步骤3:确定人格特质组合的最佳补充书籍 为了简化此演示,我们将采用“利用余弦距离来缩小间隙”的方法:例如,如果参与者对“我在周围的人感觉很舒服”给出了5分之2的答案,则我们将对该答案进行加权。 4(6减2)。 如果答案是“我开始对话。”,则答案为5分之5,我们将其加权为1(6减5)。
2022-12-08 21:16:43 18.39MB JupyterNotebook
1
中图网爬取的二手房数据——NoSQL综合项目数据集,对HBase、Redis、MongoDB、Neo4j等NoSQL数据库进行增删改查操作,并对MongoDB进行基本的统计分析。
2022-12-08 13:15:54 1024KB NoSQL 书籍数据
1
使用spark+flask做的小项目
2021-09-16 09:39:43 2.9MB flask spark
1
基于Python Scrapy实现的爬取豆瓣读书9分榜单的书籍数据采集爬虫系统 含数据集和全部源代码 # -*- coding: utf-8 -*- import scrapy import re from doubanbook.items import DoubanbookItem class DbbookSpider(scrapy.Spider): name = "dbbook" # allowed_domains = ["https://www.douban.com/doulist/1264675/"] start_urls = ( 'https://www.douban.com/doulist/1264675/', ) URL = 'https://www.douban.com/doulist/1264675/?start=PAGE&sort=seq&sub_type=' def parse(self, response): # print response.body item = DoubanbookItem() selector = scrapy.Selector(response) books = selector.xpath('//div[@class="bd doulist-subject"]') for each in books: title = each.xpath('div[@class="title"]/a/text()').extract()[0] rate = each.xpath('div[@class="rating"]/span[@class="rating_nums"]/text()').extract()[0] author = re.search('(.*?)
2021-07-10 17:02:47 19KB python scrapy 爬虫 数据采集
平蛇
2021-02-17 18:05:49 1KB Python
1