P-HAR: Công nhận hành động của con người khiêu dâm
dài quá đọc không nổi
Nhận dạng hành động của con người đã nổi lên như một lĩnh vực nghiên cứu tích cực trong cộng đồng học sâu. Mục tiêu chính liên quan đến việc xác định và phân loại hành động của con người trong video bằng cách sử dụng nhiều luồng đầu vào, chẳng hạn như dữ liệu video và âm thanh. Các mô hình hiệu quả nhất về hiệu suất bao gồm các kiến trúc dựa trên biến áp cho luồng RGB, PoseC3D cho luồng khung và ResNet101 cho luồng âm thanh.