今日 Paper | 旋轉不變混合圖形模型網路;人體移動軌跡;行人再識別;基準成像系統等

  • 2020 年 2 月 24 日
  • 筆記

目錄
  • 用於二維手勢估計的旋轉不變混合圖形模型網路
  • 從人體移動軌跡中學習具有空間層次的細粒度位置嵌入
  • 中等服裝變化下基於輪廓草圖的行人再識別
  • 基準成像系統的綜合資料庫
  • 基於雙向語言模型的半監督序列標註

用於二維手勢估計的旋轉不變混合圖形模型網路

論文名稱:Rotation-invariant Mixed Graphical Model Network for 2D Hand Pose Estimation

作者:Kong Deying /Ma Haoyu /Chen Yifei /Xie Xiaohui

發表時間:2020/2/5

論文鏈接:https://arxiv.org/abs/2002.02033v1

推薦原因

這篇論文發表於WACV 2020,考慮的是二維手姿勢估計問題。

這篇論文提出了一種名為旋轉不變混合圖形模型網路(R-MGMN)的網路架構,用來解決單攝影機採集的RGB影像中的二維手姿勢估計問題。通過集成一個旋轉網路,R-MGMN可以應對影像中手的旋轉。R-MGMN還具有一個圖形模型庫,可以根據輸入影像來選擇圖形模型的組合。R-MGMN通過在每個圖形模型上執行置信傳播來生成一組邊際分布,然後將這些邊際分布作為手部關鍵點位置的置信度映射,最終所有的置信度映射合在一起得到最終的置信度映射。這篇論文在兩個公共手勢數據集上評估了R-MGMN,實驗結果表明R-MGMN明顯優於其他的演算法。

從人體移動軌跡中學習具有空間層次的細粒度位置嵌入

論文名稱:Learning Fine Grained Place Embeddings with Spatial Hierarchy from Human Mobility Trajectories

作者:Shimizu Toru /Yabe Takahiro /Tsubouchi Kota

發表時間:2020/2/6

論文鏈接:https://arxiv.org/abs/2002.02058v1

推薦原因

這篇論文考慮的是位置嵌入問題。

以往的研究通過人員流動軌跡來生成位置嵌入,而實際應用需要具有高空間解析度的位置嵌入。由於數據稀疏性,許多應用不得不降低空間解析度,從而導致位置嵌入品質的降低。為了解決這個問題,這篇論文提出了一種生成細粒度位置嵌入的方法,根據觀察到的數據點的局部密度來利用空間層次資訊。基於日本3個城市的真實世界軌跡數據,這篇論文實驗了下一個位置的預測任務,驗證了所提的位置嵌入方法的有效性。

中等服裝變化下基於輪廓草圖的行人再識別

論文名稱:Person Re-identification by Contour Sketch under Moderate Clothing Change

作者:Yang Qize /Wu Ancong /Zheng Wei-Shi

發表時間:2020/2/6

論文鏈接:https://arxiv.org/abs/2002.02295v1

推薦原因

這篇論文要解決的是行人重識別問題。

與以往只考慮同一個著裝的行人重識別問題不同,這篇論文定義了跨服飾行人重識別問題,即在不同著裝下的行人重識別任務。這篇論文考慮的是在短時間內,天氣沒有變化,因此行人穿著的衣服的厚度沒有大的變化,從而通過處理行人影像的輪廓草圖,而不是通過衣服的顏色資訊,來提取特徵。這種方式可以對於服飾的變化更加魯棒。這篇論文還為了這個問題建了一個來自221個行人的包含33698張影像的數據集。通過在新數據集上的實驗,這篇論文驗證了所提方法的有效性。

基準成像系統的綜合資料庫

論文名稱:A Comprehensive Database for Benchmarking Imaging Systems

作者:Karen Panetta /Qianwen Wan /Sos Agaian /Srijith Rajeev /Shreyas Kamath /Rahul Rajendran /Shishir Paramathma Rao /Aleksandra Kaszowska /Holly A. Taylor / Arash Samani /Xin Yuan

發表時間:2018/11/30

論文鏈接:https://ieeexplore.ieee.org/document/8554155

推薦原因

這篇論文貢獻了Tufts大學收集的人臉資料庫,包含了來自15個以上國家/地區的113位個人的10,000多張影像,包含了不同的性別身份、年齡和種族背景。這些人臉影像是從Tufts大學的學生、教職員工及其家屬那裡採集的,能夠為人臉識別相關的研究提供更加魯棒的演算法測試。同時這篇論文也回顧了目前已有的其他人臉識別相關的數據集。

基於雙向語言模型的半監督序列標註

論文名稱:Semi-supervised sequence tagging with bidirectional language models

作者:Matthew E. Peters /Waleed Ammar /Chandra Bhagavatula /Russell Power

發表時間:2017/4/29

論文鏈接:https://arxiv.org/pdf/1705.00108.pdf

推薦原因

本文解決的問題:本論文是針對訓練語料不足的問題,解決這個問題的核心就是使用遷移學習的思想以及半監督的方式。

創新點:該論文使用海量無標註語料庫訓練了一個雙向神經網路語言模型,然後使用這個訓練好的語言模型來獲取當前要標註詞的語言模型向量(LM embedding),然後將該向量作為特徵加入到原始的雙向RNN-CRF模型中。

研究意義:實驗結果表明,在少量標註數據上,加入這個語言模型向量能夠大幅度提高NER效果,即使在大量的標註訓練數據上,加入這個語言模型向量仍能提供原始RNN-CRF模型的效果。