上传者: 42143806
|
上传时间: 2022-03-23 09:03:11
|
文件大小: 527KB
|
文件类型: -
活动识别
使用智能手机和智能手表数据使用Apache Spark和H20预测活动。 可以预测的活动示例包括:
坐着
步行
吃
打字
常设
运球篮球等...
使用SparkML和H20在Apache Spark分析中完成数据预处理
数据集
“ WISDM智能手机和Smartwatch活动和生物识别数据集”
原始时间序列传感器数据
描述的数据集说明
**项目中采取的步骤如下:**
1)特征提取
提取用于预测上述活动的功能:
subject_id
是SmartPhone还是SmartWatch数据?
设备类型:加速度计和/或陀螺仪
时间戳记
x,y和z坐标提取标签:
代表每个活动的活动代码
将所有这些信息组织到spark RDD中,然后组织到Spark DataFrame中
编码
2)数据预处理
对于每个活动,包括以下所有百分比读数:
x,y,z坐标
按时间戳排序
还包括来自下一