R_training_Project_1 使用R项目1进行数据分析:使用NHTS 2017数据集进行探索性数据分析 调查名称:017全国家庭旅行调查-加利福尼亚附加项目 资料来源: : 团队Spreasheet 数据说明 包含CSV文件 1. household data 2. location data 3. person data 4. Trips data 5. vehicles data 贴标 尝试使用thsc-nhts17-caltranscodebook.xlsx标记值使用字典tsdc-nhts17-caltrans-datadictionary.pdf了解数据 缺失值 缺少的值已编码为lile -9,-8,-7等。检查标签是否正确 指示 1. Importing and understanding the data 2. Examples of data aggreg
2021-02-28 10:05:01 9KB R
1
线性回归餐厅情感分析 目录表 描述 线性回归机器学习模型可预测评论是肯定的还是否定的。 它以86%的准确度正确预测正确的标签。 技术领域 使用以下项目创建项目: python版本:3.9.1 NumPy库版本:1.20.0 熊猫库版本:1.2.2 数据集 制作数据集后,每个功能都是代表餐厅评论中所使用单词的存在或不存在的分类特征(0、1)。 常见词(例如“ the”,“ a”等)未分类。 每行代表一个点(餐厅评论),每列代表其特征(评论中是否使用单词)。 除了评论是肯定的(1)还是否定的(0),每列都是除包含标签的最后一列之外的单独功能。 设置 下载.py文件,training_dataset,validation_dataset和权重文件。 将它们放在单个文件或项目文件中。 运行代码 将以下内容添加到类文件中: x = logistic_regression("train_d
2021-02-26 12:05:53 4.99MB Python
1
认证证书 可能缺少数据的广义典范相关分析
2021-02-23 14:02:49 1.96MB R
1
聚类分析 不要忘记在pom.xml中添加“ json-simple”作为项目的依赖 在运行程序之前,将开源物理库导入项目( ) 要创建导入文件,请调用randomDataGenerator.js脚本 var1是导入文件的标题(例如dataFile) var2是集群节点的数量(例如25) var3是概率(例如0.3) 如果运行初始化而不导入数据文件,它将在变量中生成具有指定计数和边沿概率的随机点 个人实验结果 我已经从项目中创建了数据文件,节点是方法,边缘是函数调用。初始状态描述在./Sample Data / Analysis_Functions.txt文件中,固定的数据文件是./Sample Data / analysis.json 这是集群的初始状态 这是形成的团簇 ./Sample Data / Analysis_Cluster.txt文件中的文本形式也描述了群集
2021-02-22 10:04:44 182KB JavaScript
1
hurdat分析
2021-02-22 10:04:41 856KB R
1
dataScienceProject:2016年至2020年的nytimes元数据分析
2021-02-20 20:09:26 2.69MB JupyterNotebook
1
nsf-oce-gender NSF海洋科学奖中的性别差异分析 在这一系列的Jupyter笔记本电脑中,我们: 清理并准备1987年至2019年的NSF海洋科学奖数据以进行分析 确定研究主题 从PI和联合PI的名字中提取性别信息 在以下方面检查NSF海洋科学奖中的性别差异: 所有NSF-OCE奖项 NSF-OCE计划中排名前10位的奖项最多 奖项数量排名前10位的学术组织 确定的研究主题 奖励类型 在NSF-OCE授予WHOI的奖项中检查性别差异: NSF-OCE计划中排名前10位的奖项最多 确定的研究主题 奖励类型 伊万·利马-2020年11月5日星期四20:06:50 -0500
2021-02-20 12:04:08 5.45MB JupyterNotebook
1
IMDB电影分析
2021-02-20 09:05:08 4.01MB JavaScript
1
制药公司使用Matplotlib开发的药物的性能比较 这项研究的目的是比较Pymaceuticals感兴趣的药物Capomulin与其他治疗方案的性能。 数据包括通过各种药物方案治疗了250只经鉴定为SCC肿瘤生长的小鼠。 在45天的过程中,观察并测量了肿瘤的发展。 它包括研究技术报告所需的所有表格和数据,以及研究结果的顶级摘要。
2021-02-18 11:06:32 272KB
1
时间系列分析
2021-02-17 18:05:49 1.26MB HTML
1