今日 Paper | 二氧化碳排放預測；3D人臉重建；BERTology入門；動態場景重建等

2020 年 4 月 1 日
筆記

用機器學習方法對電網中的二氧化碳排放強度進行短期預測

論文名稱：Short-Term Forecasting of CO2 Emission Intensity in Power Grids by Machine Learning

作者：Kenneth Leerbeck /Peder Bacher /Rune Junker /Goran Goranović /Olivier Corradi /Razgar Ebrahimy /Anna Tveit /Henrik Madsen

發表時間：2020/3/10

論文鏈接：https://arxiv.org/abs/2003.05740

推薦原因

1 核心問題

本文主要解決的是用機器學習方法來預測丹麥招標地區中電網二氧化碳的排放強度，區分平均排放量和邊際排放量的問題

2 創新點

本文使用多變量線性回歸模型建模，使用傅立葉序列來對季節波動進行衡量，使用Splines來捕獲非線性特徵。在面對大量屬性時，本文結合了Lasso以及前向特徵選擇算法來進行特徵選擇。在最後的softmax層中根據不同驗證集的平均RMSE使用權重平均模型進行了處理。

3 研究意義

本文發現邊際排放量和DK2區域的狀況完全不同，說明了邊際發電機位於相鄰區域中，並且提出的方法可以在不需要提前詳細了解的情況下，用於歐洲電網中的任意投標區域。

基於圖卷積神經網絡的高保真3D人臉重建

論文名稱：Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Networks

作者：Jiangke Lin /Yi Yuan /Tianjia Shao /Kun Zhou

發表時間：2020/3/12

論文鏈接：https://arxiv.org/abs/2003.05653

推薦原因

該文章是CVPR2020的人臉重建文章。

在過去幾年中，基於3DMM的方法在從單視圖圖像恢復3D面部形狀方面取得了巨大的成功。然而通過這種方法恢復的面部紋理缺乏輸入圖像中所表現的保真度。最近也有一些工作使用在高質量面部紋理UV貼圖的大規模數據集中訓練的生成網絡，能夠生成高質量的面部紋理，但數據集很難準備且沒有公開。

本文介紹了一種從單視角自然圖像重建具有高保真紋理的3D面部形狀的方法，無需大規模的面部紋理數據庫。其主要思想是使用來自輸入圖像的面部細節來優化基於3DMM方法生成的初始紋理，使用圖卷積網絡來重建網格頂點的詳細顏色而不是重建紋理貼圖。實驗表明文章方法可以產生高質量的重建結果，優於最新的方法。

BERTology入門：解讀BERT的工作原理

論文名稱：A Primer in BERTology: What we know about how BERT works

作者：Anna Rogers

發表時間：2020/2/7

論文鏈接：https://arxiv.org/pdf/2002.12327.pdf

推薦原因

本文是一篇綜述性文章，概述了目前學術界對Bert已取得的研究成果，並且對後續的研究也進行了展望，適合於初入BERT模型的人員學習。本文的框架作者主要從BERT網絡結構、BERT embeddings、BERT中的句法知識（Syntactic knowledge）、語義知識（Semantic knowledge）和知識庫（World knowledge）以及Self-attention機制等角度對當下學術界對BERT的研究進行了說明，基於前面的介紹，作者對BERT是如何訓練、當模型過於複雜時應給如何解決等問題給出了相應的解決方案。最後作者對BERT未來的研究方向以及需要解決的問題提出了展望。

DymSLAM：基於幾何運動分割的動態場景重建

論文名稱：DymSLAM:4D Dynamic Scene Reconstruction Based on Geometrical Motion Segmentation

作者：Chenjie Wang /Bin Luo /Yun Zhang /Qing Zhao /Lu Yin /Wei Wang /Xin Su /Yajun Wang /Chengyuan Li

發表時間：2020/3/10

論文鏈接：https://arxiv.org/abs/2003.04569

推薦原因

大多數SLAM算法都是基於靜態場景假設，但實際情況下大多數場景都是動態的，包含動態對象，因此此類方法都不適用。

本文提出了DymSLAM，一種基於動態立體實際SLAM系統，能夠重建包含剛性運動對象的4D(3D+時間)動態場景。DymSLAM的唯一輸入是立體視頻，輸出靜態環境的密集圖，運動對象的3D模型以及相機和運動對象的軌跡。系統首先使用傳統SLAM方法檢測並匹配連續幀直接的興趣點，然後通過多模型擬合算法將屬於不同運動模型(包括自我運動和剛性對象運動)的興趣點進行分割。基於自我運動的興趣點預測相機軌跡和靜態背景，基於剛性對象運動的興趣點用於估計對象相對於相機的相對運動並重建對象的3D模型。最後再3D對象的運動融合到環境的3D地圖中，以獲得4D序列。

問題提出了包含剛性運動物體的SLAM系統，能夠重建場景中剛性運動對象的模型及其運動軌跡，可以用於機械人的動態物體避障等眾多應用。

The Virtual Tailor: 基於人體姿態、形狀和服裝類型的3D服裝預測

論文名稱：The Virtual Tailor: Predicting Clothing in 3D as a Function of Human Pose, Shape and Garment Style

作者：Patel Chaitanya /Liao Zhouyingcheng /Pons-Moll Gerard

發表時間：2020/3/10

論文鏈接：https://arxiv.org/abs/2003.04583

推薦原因

如何快速準確逼真地模擬、預測人體衣服的形變是計算機圖形學中的一個重要問題，在諸如AR/VR、虛擬試衣等眾多領域都有着應用。

本文提出了TailorNet神經網絡模型，其可以根據人體形狀、姿態和服裝類型來預測衣服的形變，並同時保留衣服的褶皺等局部細節。文章技術的核心是將衣服的形狀分解為高頻部分和低頻部分，其中低頻部分的信息從人體形狀、姿態和衣服類別預測，高頻部分的細節從形狀風格相關的姿態模型來預測並混合得到。作者將其構造的包含55800幀的數據集開源，項目主頁https://virtualhumans.mpi-inf.mpg.de/vtailor。