动作识别

2024/4/11 13:12:18

论文阅读:Self-supervised video representation learning with space-time cubic puzzles

论文名称:Self-supervised video representation learning with space-time cubic puzzles(2019 AAAI) 论文作者:Dahun Kim, Donghyeon Cho, In So Kweon 下载地址:https://ojs.aaai.org/index.php/AAAI/article/vie…

论文阅读 + 复现:(LRCNs)Long-term Recurrent Convolutional Networks for Visual Recognition and Description

目录 写在前面 网络架构 论文中的训练细节 复现代码时遇到的问题 & 解决方案 1、如何动态调整 pretrained model 中的 layer? 2、RuntimeError: Input and parameter tensors are not at the same device, found input tensor at cpu and parameter tenso…

论文阅读:(MS-G3D)Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition

目录 Summary Details 1、多尺度聚合 2、时空图卷积 G3D 算子 3、两者结合(MS-G3D) 4、整体网络框架 论文名称:Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition(2020 CVPR&#xff0…

机器学习笔记 - 用于动作识别的网络TSN/TSM/SlowFast/R(2+1)D/3D MobileNetV2

一、简述 动作识别是在视频序列中检测和分类人类动作的过程。 近年来,由于其广泛的应用,它已成为一项越来越重要的技术,例如监控、人机交互以及视频索引和检索。 特别是,动作识别对于无人驾驶飞行器 (UAV) 或无人机来说变得至关重要,因为它们越来越多地用于各种应用,例如…

行为分析(商用级别)06 -完成训练自定义数据集的config文件修改-落地核心关键(必读篇)

以下链接是个人关于行为分析(商用级别)所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。文末附带 公 众 号 − \color{blue}{公众号 -} 公众号−

【论文阅读笔记】(2021 CVPR)3D Human Action Representation Learning via Cross-View Consistency Pursuit

写在前面 方法部分好多公式变量,编辑器再打一遍好麻烦。。。偷个懒,就直接把这部分的笔记导出成图片咯,并且我按我自己理解比较顺的逻辑重新捋了一下。 3D Human Action Representation Learning via Cross-View Consistency Pursuit &…

动作识别0-08:mmaction2(SlowFast)-源码无死角解析(4)-数据加载,预处理-1(重点篇)

以下链接是个人关于mmaction2(SlowFast-动作识别) 所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。…

动作识别0-01:mmaction2(SlowFast)-资源下载(前奏准备)

以下链接是个人关于mmaction2(SlowFast-动作识别) 所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。…

【论文阅读笔记】(2022 ECCV)Contrastive Positive Mining for Unsupervised 3D Action Representation Learning

论文题目:Contrastive Positive Mining for Unsupervised 3D Action Representation Learning 论文下载地址:https://arxiv.org/pdf/2208.03497.pdf 目录 0. 论文简介 & 创新点 1、Contrastive Positive Mining (CPM) 2、Similarity Distributio…

论文阅读:Video Action Transformer Network

目录 Objective (Task) Motivation Proposed Method Trunk: I3D Region Proposal Network(RPN): Faster R-CNN Action Transformer Head Dataset Submission Format Result & Analysis Action classification with GT person boxes Localization performance (a…

解读 2s-AGCN 代码

【2022.3.22 更新】 论文方法笔记参考:【论文阅读笔记】(2s-AGCN)Two-Stream Adaptive Graph Convolutional Networks for Skeleton-Based Action Recognit_小吴同学真棒的博客-CSDN博客 目录 NTU RGBD 120 数据示例 A(Graph&a…

论文阅读:Mining actionlet ensemble for action recognition with depth cameras

目录 Summary Details 1、Invariant Features for 3D Joint Positions(skeleton feature) 具体怎么做 提取这个特征的好处 2、Local Occupancy Patterns(LOP feature) 设计这个特征的目的 具体怎么做 3、Fourier Tempora…

【论文阅读笔记 + 代码解读】(2018 AAAI)ST-GCN

写在前面 ST-GCN 是skeleton based action recognition 的开山鼻祖。MMLab 出品,必是精品! 开山鼻祖级别的论文必有很多理论 数学公式,再加上本人(菜鸡)既不是数学专业又不是计软本科出身的,所以第一次看…

论文学习:Learning spatio-temporal features with 3D convolutional networks

0. 目录 Abstract & Contribution Introduction Learning Features with 3D ConvNets 3.1 2D 卷积 & 3D 卷积的区别 作者又提到了这篇文章与 [18] 的区别 这篇文章的主要工作 Common network settings Varying network architectures 3.2 Exploring kernel te…

【论文阅读笔记】(2021 ICCV)Video Pose Distillation for Few-Shot, Fine-Grained Sports Action Recognition

Video Pose Distillation for Few-Shot, Fine-Grained Sports Action Recognition (2021 ICCV) James Hong, Matthew Fisher, Michael Gharbi, Kayvon Fatahalian Notes 写在前面(中文版自己总结) 之前的 AR(Actio…

论文阅读:(2020 AAAI) Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning

Video Cloze Procedure for Self-Supervised Spatio-Temporal Learning (2020 AAAI) Dezhao Luo, Chang Liu, Yu Zhou, Dongbao Yang, Can Ma, Qixiang Ye, Weiping Wang Notes 论文:Video Cloze Procedure for Self-Supervised Spatio-Te…

论文阅读:Why Can’t I Dance in the Mall Learning to Mitigate Scene Bias in Action Recognition

目录 Background How To Do 网络的整体框架 Result Question(Things To Do) 论文下载地址:https://arxiv.org/abs/1912.05534 code:https://github.com/vt-vl-lab/SDN project website:http://chengao.vision/S…

基于骨骼的动作识别:PoseConv3D

Revisiting Skeleton-based Action Recognition解读摘要1. 简介2. Related Work2.1 基于3D-CNN的rgb视频动作识别2.2 基于GCN的骨骼动作识别2.3 基于CNN的骨骼动作识别3. Framework3.1 Pose Extraction3.2 From 2D Poses to 3D Heatmap Volumes3.3 基于骨骼的动作识别3D-CNN3.3…

动作识别0-00:mmaction2(SlowFast)-目录-史上最新无死角讲解

接下来,我会为大家无死角的解析mmaction2(SlowFast-动作识别),之前的文章,如下(以下是我工作的所有项目,每一个项目都是,我都做了百分百的详细解读,随着项目增多,为了方便不臃肿,所以…

用于骨骼动作识别的卷积网络模型——综述

相关研究骨架数据模态基于骨架模态数据的 HAR 方法总结三维卷积网络图卷积网络模型ST-GCNAS-GCN2s-AGCNMS-AAGCNCTR-GCN相关研究 近年来,基于 GCN 的 HAR 已成为一个热门研究方向。 Yan 等通过引入时空 GCNs (ST-GCNs)来利用 GCNs 进行基于骨骼的 HAR, ST-GCNs 可以自动从骨骼…

动作识别0-03:mmaction2(SlowFast)-白话给你讲论文-翻译无死角(1)

以下链接是个人关于mmaction2(SlowFast-动作识别) 所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。…

Hi-TRS:骨架点视频序列的层级式建模及层级式自监督学习

论文题目:Hierarchically Self-Supervised Transformer for Human Skeleton Representation Learning 论文下载地址:https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136860181.pdf 代码地址:https://github.com/yuxiaochen1103…

动作识别0-02:mmaction2(SlowFast)-官方数据训练测试-ucf101

以下链接是个人关于mmaction2(SlowFast-动作识别) 所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。…

论文阅读:View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skel

目录 Motivation Preliminaries 视角变换的数学公式: Proposed Method 论文名称:View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skeleton Data(2017 ICCV) 下载地址&#xf…

PaddleVideo:PP-TSM 视频分类

本文记录:使用Paddle框架训练TSM(Temporal Shift Module) 前提条件:已经安装Paddle和PadleVideo,具体可参考前一篇文章。 1-数据准备: 以UCF101为例:内含13320 个短视频,视频类别&…

论文阅读:Adding Attentiveness to the Neurons in Recurrent Neural Networks

目录 Summary Details (Implementation) 原来的 RNN 结构 变为 Element-wise-Attention Gate (EleAttG) 后 论文名称:Adding Attentiveness to the Neurons in Recurrent Neural Networks(2018 ECCV) 下载地址:https://arxiv…

CV计算机视觉每日开源代码Paper with code速览-2023.11.7

精华置顶 墙裂推荐!小白如何1个月系统学习CV核心知识:链接 点击CV计算机视觉,关注更多CV干货 论文已打包,点击进入—>下载界面 点击加入—>CV计算机视觉交流群 1.【基础网络架构】Understanding Deep Representation Lea…

机器学习笔记 - GluonCV:基于MXNet/PyTorch + Kinetics400 + 各种先进网络的动作识别的预训练模型

一、简述 GluonCV 提供计算机视觉领域最先进 (SOTA) 深度学习算法的实现。它旨在帮助工程师、研究人员和学生快速制作产品原型、验证新想法并学习计算机视觉。 同时支持 PyTorch 和 MXNet。 GluonCV 提供了分类、检测、分割、姿势估计、动作识别、深度预测这几类的预训练模型,…

机器学习笔记 - 基于自定义数据集 + 3D CNN进行视频分类

一、简述 这里主要介绍了基于自定义动作识别数据集训练用于视频分类的 3D 卷积神经网络 (CNN) 。3D CNN 使用三维滤波器来执行卷积。内核能够在三个方向上滑动,而在 2D CNN 中它可以在二维上滑动。 这里的模型主要基于D. Tran 等人2017年的论文“动作识别的时空卷积研究”。 …