Skip to content

Latest commit

 

History

History
135 lines (82 loc) · 4.21 KB

File metadata and controls

135 lines (82 loc) · 4.21 KB

English | 简体中文

ST-GCN基于骨骼的行为识别模型


内容

模型简介

ST-GCN是AAAI 2018提出的经典的基于骨骼的行为识别模型,通过将图卷积应用在具有拓扑结构的人体骨骼数据上,使用时空图卷积提取时空特征进行行为识别,极大地提升了基于骨骼的行为识别任务精度。


数据准备

FSD-10数据下载及准备请参考FSD-10数据准备

NTU-RGBD数据下载及准备请参考NTU-RGBD数据准备

模型训练

FSD-10数据集训练

  • FSD-10数据集使用单卡训练,启动命令如下:
python3.7 main.py -c configs/recognition/stgcn/stgcn_fsd.yaml
  • 由于赛事未提供验证集数据,因此训练时不做valid。

  • 您可以自定义修改参数配置,以达到在不同的数据集上进行训练/测试的目的,参数用法请参考config

NTU-RGBD数据集训练

  • NTU-RGBD数据集使用4卡训练,启动命令如下:
python3.7 -B -m paddle.distributed.launch --gpus="0,1,2,3"  --log_dir=log_stgcn  main.py  --validate -c configs/recognition/stgcn/stgcn_ntucs.yaml
  • 配置文件stgcn_ntucs.yaml为NTU-RGB+D数据集按cross-subject划分方式对应的训练配置。

模型测试

FSD-10数据集模型测试

  • 模型测试的启动命令如下:
python3.7 main.py --test -c configs/recognition/stgcn/stgcn_fsd.yaml -w output/STGCN/STGCN_epoch_00060.pdparams
  • 通过-c参数指定配置文件,通过-w指定权重存放路径进行模型测试。

  • 评估结果保存在submission.csv文件中,可在评测官网提交查看得分。

模型在FSD-10数据集上baseline实验精度如下:

Test_Data Top-1 checkpoints
Test_A 86.66 STGCN_fsd.pdparams
Test_B 85.0 -

NTU-RGB+D数据集模型测试

  • 模型测试的启动命令如下:
python3.7 main.py --test -c configs/recognition/stgcn/stgcn_ntucs.yaml -w output/STGCN/STGCN_best.pdparams
  • 通过-c参数指定配置文件,通过-w指定权重存放路径进行模型测试。

模型在NTU-RGB+D数据集上实验精度如下:

split Top-1 checkpoints
cross-subject 82.28 STGCN_ntucs.pdparams

模型推理

导出inference模型

python3.7 tools/export_model.py -c configs/recognition/stgcn/stgcn_fsd.yaml \
                                -p data/STGCN_fsd.pdparams \
                                -o inference/STGCN

上述命令将生成预测所需的模型结构文件STGCN.pdmodel和模型权重文件STGCN.pdiparams

使用预测引擎推理

python3.7 tools/predict.py --input_file data/fsd10/example_skeleton.npy \
                           --config configs/recognition/stgcn/stgcn_fsd.yaml \
                           --model_file inference/STGCN/STGCN.pdmodel \
                           --params_file inference/STGCN/STGCN.pdiparams \
                           --use_gpu=True \
                           --use_tensorrt=False

输出示例如下:

Current video file: data/fsd10/example_skeleton.npy
        top-1 class: 0
        top-1 score: 0.9847044944763184

可以看到,使用在FSD-10上训练好的pp-AGCN模型对data/example_skeleton.npy进行预测,输出的top1类别id为0,置信度为0.98。

参考论文