数据分析——基础概念环境、matplotlib、numpy、pandas 文件包括数据分析课程ppt+京东腾讯面试经验分享
1
# -*- coding: utf-8 -*- import pandas as pd import numpy as np from math import sqrt critics={'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5, 'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree': 2.5, 'The Night Listener': 3.0}, 'Gene Seymour': {'Lady in the Water': 3.0, 'Snakes on a Plane': 3.5, 'Just My Luck': 1.5, 'Superman Returns': 5.0, 'The Night Listener': 3.0, 'You, Me and Dupree': 3.5}, 'Michael Phillips': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.0, 'Superman Returns': 3.5, 'The Night Listener': 4.0}, 'Claudia Puig': {'Snakes on a Plane': 3.5, 'Just My Luck': 3.0, 'The Night Listener': 4.5, 'Superman Returns': 4.0, 'You, Me and Dupree': 2.5}, 'Mick LaSalle': {'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0, 'Just My Luck': 2.0, 'Superman Returns': 3.0, 'The Night Listener': 3.0, 'You, Me and Dupree': 2.0}, 'Jack Matthews': {'Lady in the Water': 3.0, 'Snakes on a Plane': 4.0, 'The Night Listener': 3.0, 'Superman Returns': 5.0, 'You, Me and Dupree': 3.5}, 'Toby': {'Snakes on a Plane':4.5,'You, Me and Dupree':1.0,'Superman Returns':4.0}} df_critics=pd.DataFrame(critics) ##欧氏距离 def sim_distance(prefs,person1,person2): si={} for item in prefs[person1]: if item in prefs[person2]: si[item]=1 if len(si)==0: return 0 sum_of_squares=sum([pow(prefs[person1][item]-prefs[person2][item],2) for item in prefs[person1] if item in prefs[person2]]) return 1/(1+sqrt(sum_of_squares)) ##numpy pandas 方法 def sim_distance2(prefs,person1,person2): return 1/(1+np.linalg.norm(prefs[person1]-prefs[person2])) ##皮尔逊相关系数 def sim_pearson(prefs,p1,p2): si={} for item in prefs[p1]: if item in prefs[p2]: si[item]=1 n=len(si) if n==0: return 1 ##对所有偏好求和 sum1=sum([prefs[p1][it] for it in si]) sum2=sum([prefs[p2][it] for it in si]) ##求平方和 sum1Sq=sum([pow(prefs[p1][it]
《机器学习与模式识别》课程大作业答案(Jupyter版本/含数据集)#资源达人分享计划# (《机器学习》&《模式识别》课程方案) 银行信用卡风险模型 任务1.(30分)考察数据分析能力 任务2. (50分)考察数据建模能力 任务3. (20分)考察模型评估及优化能力 学生可以从四个方面建模:申请者评级模型,行为评级模型,催收评级模型,欺诈评级模型,全面分析银行信用卡信用风险。 作业地址:https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXA027+Self-paced/courseware/1d13e10f8d4a47688375e8a33405ab59/4959a5991e7545fb884b7f37345371a5/
1
企业统计培训的难题 领导总是抱怨统计人员的分析过于简单,统计人员总是觉得领导苛求,竭尽全力也玩不成花样,于是指望通过培训解决问题 培训者总是偏向对付复杂数据的高级方法,受训者总是学会了高级方法照样无能为力,于是感觉培训解决不了问题
2021-07-25 20:03:05 285KB 数据分析 数据挖掘 统计分析 培训
该资源为2013-2014年哈尔滨工业大学854计算机基础(含数据结构、计算机组成原理)考研真题,资源高清无水印哦!
该资源为2017年哈尔滨工业大学854计算机基础(含数据结构、计算机组成原理)之计算机组成原理考研题库及答案详解,资源高清无水印哦!
基于tensorflow的IMDB文本情感分析完整代码(包含数据和词向量可直接运行),网络结构采用双层LSTM。
2021-07-20 17:08:03 164.63MB tensorflow IMDB LSTM
基于Python Scrapy实现的爬取豆瓣读书9分榜单的书籍数据采集爬虫系统 含数据集和全部源代码 # -*- coding: utf-8 -*- import scrapy import re from doubanbook.items import DoubanbookItem class DbbookSpider(scrapy.Spider): name = "dbbook" # allowed_domains = ["https://www.douban.com/doulist/1264675/"] start_urls = ( 'https://www.douban.com/doulist/1264675/', ) URL = 'https://www.douban.com/doulist/1264675/?start=PAGE&sort=seq&sub_type=' def parse(self, response): # print response.body item = DoubanbookItem() selector = scrapy.Selector(response) books = selector.xpath('//div[@class="bd doulist-subject"]') for each in books: title = each.xpath('div[@class="title"]/a/text()').extract()[0] rate = each.xpath('div[@class="rating"]/span[@class="rating_nums"]/text()').extract()[0] author = re.search('(.*?)
2021-07-10 17:02:47 19KB python scrapy 爬虫 数据采集
基于MATLAB2020a版本进行R-CNN检测交通指示牌,代码100%可用。压缩包里面有RCNN训练代码、RCNN测试代码、交通指示牌数据集等文件。
2021-07-02 22:06:15 841KB MATLAB RCNN 目标检测 交通指示牌
SQL语句典型练习题(5套含数据
2021-07-01 18:05:41 178KB sql
1