由上海交通大學盧策吾團隊開發的開源項目-AlphaPose,是一個多人姿態估計系統,具有極高的精準度。AlphaPose 是基于騰訊優圖和盧策吾團隊在 ICCV 2017 上的分區域多人姿態識別算法(RMPE),該算法主要為了解決在人物檢測結果不準的情況下進行穩定的多人姿態識別問題。
AlphaPose 在姿態估計標準測試集 MSCOCO 上達到 72.3 mAP,是首個超過 70 mAP 的開源系統, 比 Mask-RCNN 相對提高 8.2%,比 OpenPose(CMU)相對提高 17%。
設計思路:綜合利用了對稱性空間遷移網絡(Symmetric Spatial Transformer Network)和單人姿態估計算法,從而擺脫了多人姿態識別任務對人物檢測準確性的依賴,并且進一步通過參數化的人物姿態表達對識別結果進行了優化。根據在公開數據集MPII上的測試結果,該算法相較CMU提出的OpenPose算法提升了1個百分點,尤其是對手肘、手腕、膝蓋、腳踝等細小關鍵點的改善尤為明顯。
應用案例:
視頻姿態跟蹤(Pose Tracking):為了匹配同一個人在不同幀中的姿態,團隊開源了一個高效的線上姿態跟蹤器(Pose Tracker)——Pose Flow。Pose Flow 是第一個在 PoseTrack Challenge 數據集上的 mAP 超過 60 (66.5 mAP) 、MOTA 超過50 (58.3 MOTA) 的線上開源姿態跟蹤器(Pose Tracker)。
視覺副詞識別(Visual Adverb Recognition):團隊提出對視覺副詞進行研究,提供了新的 ADHA 數據集,以及一個基于該姿態估計系統的算法。
掃碼關注,查看更多科技成果