假新闻挑战 这是NLP课程的最终项目。 我们的工作包括以下几个部分: 数据预处理 常规机器学习方法 Seq2seq注意模型 TextCNN和暹罗网络 其他(例如比赛中的相关工作,未来的工作) 1.数据预处理 我们提供了几种数据预处理方法:BoW(单词袋),TF-IDF,word2vec,doc2vec。 每个py文件都会生成x_1(文档表示形式)x_2(标题表示形式)和y(标签)。 这些数据可以作为间谍数据输出,可以在模型中使用。 2.常规机器学习 我们提供py文件以通过常规机器学习(例如SVM,随机森林)对实例进行分类,代码在sklearn上实现。 环境要求:sklearn numpy 3. Seq2seq注意模型 这些代码通常基于一个带有预训练模型的基于注意力的序列到序列模型( )。 要使用代码生成文本摘要。 运行:python3 run_summarization.py -
1
步态检测 从IMU数据集中检测两个阶段(摆动和站姿)。 安装两个IMU传感器,一个在膝盖上方,另一个在膝盖下方。 受试者应在跑步机上以可变速度行走至少2分钟,以便记录每个步态周期的每个数据。 将文件另存为.csv 第一个文件是大腿数据,第二个文件是小腿数据。 对每个阶段使用阈值,然后应用knn对阶段进行分类。 通过这种方法,我正确地获得了2个正确的阶段,即Swing阶段和Stance阶段。 编译并运行main.cpp文件。 关闭控制台窗口后,标记的数据将保存在data.dat文件中。 我将.dat文件转换为.txt文件,并上传了它,以方便您使用。 IMU传感器的采样频率为200Hz
2022-03-02 15:10:54 44KB swing cplusplus gait stance-detection
1