利用numpy,在python中 统计书本的平均评分 读取文件rating.txt中的的数据并分析 1.共有10000本书,以数字id表示 2.每个用户的打分为1~5 3.每一行数据有3个数字,分别表示用户ID,书本ID,该用户对该书的打分 要求输出: 所有书本各自的平均得分
2022-01-15 20:48:24 19.53MB numpy python 数据分析
1
贷款逾期数据可以用于数据挖掘,机器学习,Python数据分析
2022-01-10 19:14:33 1.87MB 数据挖掘 机器学习 python 数据分析
有打包好的py文件下载使用,可以拿来即用,老师可以用来当做教学小案例使用。 数据分析9个优雅小技巧(测试代码+保姆级api例程),让你的代码更加python,代码优雅简洁。
2022-01-10 19:07:25 3KB Python 数据分析 优雅技巧
1
给大家分享一套课程——Python数据分析入门到实战视频课程,完整版,附源码+数据+课件。本课程教你用流行的Python做数据分析,带你用数据认识这个世界!课程讲解细致,项目案例丰富真实。
2022-01-06 17:02:42 522B Python 数据分析
1
Python3数据分析与挖掘建模实战,快速胜任数据分析师视频教程,本课程基于Python3全程以真实案例驱动,带你学习数据分析与挖掘建模领域的科学思维、必会知识、常用工具、完整流程以及老师多年的经验技巧。
2022-01-06 17:02:38 597B Python 数据分析 建模
1
1、判断题: Python语言是一种高级语言。【对】 2、多选题: Jupyter notebook中运行单元格的方法有哪几种?( ) 选项: A:Enter B:Shift+Enter C:Ctrl+Enter D:F5 答案: 【Shift+Enter;Ctrl+Enter】 3、单选题: Jupyter notebook的记事本文件扩展名为:( ) 选项: A:m B:py C:pyc D:ipynb 答案: 【ipynb】 4、判断题: Jupyter notebook 中的助手需要额外安装。答案: 【对】 5、单选题: Python安装扩展库常用的是( )工具 选项: A:setup B:update C:pip D:run 答案: 【pip】 6、单选题: 关于Python语言的注释,以下选项中描述错误的是:( ) 选项: A:python语言有两种注释方式:单行注释和多行注释 B:python语言的单行注释以#开头 C:python语言的单行注释以单引号开头 D:Python语言的多行注释以’’’(三个单引号)开头和结尾 答案: 【Python语言的单行注释以单引号开头】 7、单选题: 以下选项中,不是pip工具进行第三方库安装的作用的是:( ) 选项: A:安装一个库 B:卸载一个已经安装的第三方库 C:列出当前系统已经安装的第三方库 D:脚本程序转变为可执行程序 答案: 【脚本程序转变为可执行程序】 8、单选题: 安装一个库的命令格式是:( ) 选项: A:pip uninstall  B:pip -h C:pip install  D: ip download  答案: 【pip install 】 9、判断题: 标准的缩进格式是Python的语法之一。 选项: A:对 B:错 答案: 【对】 10、多选题: 下列导入第三库的操作中正确的是:( ) 选项: A:import numpy B:import numpy as np C:from matplotlib import pyplot D:from urllib.request import urlopen 案: 【import numpy;import numpy as np;from matplotlib import pyplot;from urllib.request import urlopen】
2022-01-04 15:27:38 34KB Python
1
添加正则化项,是指在损失函数上添加正则化项,而正则化项可分为两种: 一种是L1正则化项,另一种是L2正则化.我们把带有L2正则化项的回归模型称为岭回归,带有L1正则化项的回归称为Lasso回归.1.岭回归引用百度百科定义.岭回归(英文名:ridgeregression,Tikhonov regularization)是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得
1
TF-IDF结合余弦相似度做相似度分析 TF-IDF 优点:简单快速,结果比较符合实际情况。 缺点:以“词频”“权重”衡量一个词的重要性,仍不够全面 可能一话的词的先后顺序也会影响词语句的表达,TF-IDF无法体现 词的位置信息,出现位置靠前的词与出现位置靠后的词,都被视为 重要性相同,这是不正确的 NLP-自然语言处理 *
2021-12-30 16:26:18 2.48MB python 数据分析 自然语言处理
1
由于与作者用的版本不同的问题,这本书里面很多代码方式对模块的新版本不适用了,以下作一些记录与修改。 有关书中4-1用拉格朗日法进行插补,会有几处warning和报错, 网上大部分小伙伴都在解决过滤异常值的告警问题,其实真正有问题的是这里: 仅针对课本里出现的问题,正常的索引都是从0开始,但是当n<k的时候,索引就为负的了。老版本时会自动未申明的索引值赋值为none,但是新版本时不好使了,会直接报错。具体可查阅报错信息后的官网链接: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#deprecate-lo
2021-12-29 19:31:44 260KB list python 实战
1
本书采用基于项目的方法,介绍用Python完成数据获取、数据清洗、数据探索、数据呈现、数据规模化和自动化的过程。主要内容包括:Python基础知识,如何从CSV、Excel、XML、JSON和PDF文件中提取数据,如何获取与存储数据,各种数据清洗与分析技术,数据可视化方法,如何从网站和API中提取数据。 本书适合数据处理工作相关人员。
2021-12-29 16:37:40 11.45MB Python 数据分析 数据处理 网络爬虫
1