今日 Paper | 蚊子叫聲數據集;提高語音識別準確率;對偶注意力推薦系統等

  • 2020 年 2 月 13 日
  • 筆記

目錄

  • 提高有雜訊情況下的語音識別準確率——而且用常見工具就可以
  • 基於對偶圖注意力網路多方面社交影響的推薦系統
  • 想研究蚊子、阻止瘧疾,你需要一個蚊子叫聲數據集
  • 用於類遞增目標檢測的交叉數據集訓練
  • 卷積均值:一種簡單的用於照度估計的卷積神經網路

提高有雜訊情況下的語音識別準確率——而且用常見工具就可以

論文名稱:Improved Robust ASR for Social Robots in Public Spaces

作者:Charles Jankowski /Vishwas Mruthyunjaya /Ruixi Lin

發表時間:2020/1/14

論文鏈接:https://paper.yanxishe.com/review/8973

推薦原因:

帶有社交功能的、仿人類外型的機器人如今越來越多出現在酒店、銀行、展廳等場合,大家也很喜歡和它們聊天。不過,這種公共、開放場景中的自動語音識別(ASR)仍然是有一定難度的,尤其是環境噪音。現有的ASR模型通常在噪音較小、說話人聲音信噪比較高的情況下有不錯的表現,但一旦噪音增大,模型的表現就會有顯著下降。

這篇論文重點針對的就是有雜訊的環境下的ASR。作者們在AiShell-1中文語音數據集上進行了實驗,不僅在雜訊較高的情況下獲得了新的最好成績,同時也表明了用很容易找到的開源的工具包+幾百個小時的訓練數據就可以獲得相對高的準確率。這個結果對其他的開發者、初學者也很有借鑒意義。

基於對偶圖注意力網路多方面社交影響的推薦系統

論文名稱:Dual Graph Attention Networks for Deep Latent Representation of Multifaceted Social Effects in Recommender Systems

作者:Wu Qitian /Zhang Hengrui /Gao Xiaofeng /He Peng /Weng Paul /Gao Han /Chen Guihai

發表時間:2019/3/25

論文鏈接:https://paper.yanxishe.com/review/8984

推薦原因:

圖神經網路已經取得了巨大的成功現在很多領域得到了應用。作為與圖最相關的推薦,很多工作也嘗試引入GNN來更好的學習節點表示。本文算是比較早的引入GNN來進行推薦的論文,發表在WWW2019上。作者探索了社交影響中在user-item二部圖上影響,總共定義了4種社交影響,在通過GNN學習到表示之後,作者利用了強化學習技術來實現動態融合。實驗結果驗證了本文演算法的有效性。

想研究蚊子、阻止瘧疾,你需要一個蚊子叫聲數據集

論文名稱:HumBug Zooniverse: a crowd-sourced acoustic mosquito dataset

作者:Ivan Kiskin /Adam D. Cobb /Lawrence Wang /Stephen Roberts

發表時間:2020/1/14

論文鏈接:https://paper.yanxishe.com/review/8954

推薦原因:

深度學習的應用越來越廣,尤其是研究生物的人開始用上深度學習之後,我們就開始看到一些好笑的、出人意料的研究和數據集。

前不久四川瀕危野生動物保護國家重點實驗室 – 成都大熊貓繁育研究基地剛剛發布了一個大熊貓聲音的數據集,今天我們又看到了一個蚊子聲音的數據集。沒錯,就是那個會叮人、會傳播疾病的蚊子的數據集。

這些來自牛津大學的研究人員的收集了超過19萬段2秒長的蚊子錄音並進行了標註,其中大約有10%的數據樣本對應了蚊子的某種行為。他們希望這個數據集可以幫助更好地研究蚊子的分布和行為,他們也在論文中提供了用CNN進行分類的樣例。

這個論文還是 2019 NeurIPS ML4D workshop 的最佳論文獎得主。ML4D workshop 的主旨就是利用機器學習技術幫助發展中國家,這篇論文研究的蚊子正是發展中國家中尚未完全得到控制的瘧疾的重要傳染途徑,和workshop的目標非常吻合,也有開拓和啟發意義,得到這個最佳論文獎可謂恰如其分。

用於類遞增目標檢測的交叉數據集訓練

論文名稱:Cross-dataset Training for Class Increasing Object Detection

作者:Yao Yongqiang /Wang Yan /Guo Yu /Lin Jiaojiao /Qin Hongwei /Yan Junjie

發表時間:2020/1/14

論文鏈接:https://paper.yanxishe.com/review/8985

推薦原因:

這篇論文考慮的是跨數據集訓練的目標分類任務。

給定不同的數據集,跨數據集訓練的目標是檢測不同類別的並集,而不需要為所有數據集標記所有類別。通過這種方式,可以利用現有的數據集來訓練模型,然後應用於合併之後的數據集,並且避免了在新數據集上進行標記。這篇論文在PASCAL VOC、 COCO、 WIDER FACE和WIDER Pedestrian這些數據集上實驗了單數據集和跨數據集這兩種訓練模式。實驗結果表明與獨立訓練相比,這篇論文提出的跨數據集訓練框架可以同時在這些數據集上實現類似的性能表現。

卷積均值:一種簡單的用於照度估計的卷積神經網路

論文名稱:Convolutional Mean: A Simple Convolutional Neural Network for Illuminant Estimation

作者:Gong Han

發表時間:2020/1/14

論文鏈接:https://paper.yanxishe.com/review/8986

推薦原因:

這篇論文提出了一種名為卷積均值的用於照度估計的卷積神經網路。

這種卷積均值方法只要求一個包含大約1100參數量的小網路模型,以及一個48×32的縮略輸入圖。該方法在沒有優化的Python實現中處理速度是1毫秒1張圖片,並且在保持相同準確率的前提下,遠遠快於當前的其他方案。在兩個公共數據集上的實驗也表明了這種方法在多個度量上的準確性可與當前的最優演算法相媲美。