浮世繪面孔數據集
譯者:AI研習社(星期五)
雙語原文鏈接:Ukiyo-e faces dataset
作為論文域之間可控圖像合成的分辨率相關GAN插值[1]的一部分,我使用浮世繪的人臉圖像數據集來訓練StyleGAN模型,本文包含該數據集的鏈接和該數據集的詳細信息。
更新
-
V2-刪除了28張質量不好的圖像(對準不良或沒有正面)。
-
V1-最初的發行版,使用在與分辨率相關的GAN插值的論文中,用於域之間的可控圖像合成。
數據集
浮世繪人臉數據集包含來自浮世繪照片的5209張臉部圖像。 圖像格式為1024×1024的jpeg,並已根據FFHQ數據集所使用的過程進行了對齊。 上面是數據集中(幾乎)所有圖像的地圖,越相似的圖像彼此越靠近[2]。 為便於顯示,圖像像素已降至 256×256。
更多細節
圖片是從數個博物館網站上刮下來的,然後我試着用Amazon Rekognition從每個圖片中檢測面部和面部標誌。 Rekognition相對合理地完成了任務,但是顯然並不完美,很多面部都被遺漏了,並且許多圖像中都存在對齊錯誤。 許多圖像的分辨率不是很高,因此要生成可用的1024×1024分辨率的數據集,我使用在Manga109數據集上訓練的預訓練ESRGAN [3]模型來按需放大圖像,這些圖像偶爾會出現一些瑕疵,但大體上結果不錯。
其他數據集
KaoKore是浮世繪人臉的另一個數據集[4],它具有更多的變化和標籤,但是圖像分辨率較低且人臉未對齊。
許可和使用
此數據集是根據知識共享署名-相同方式共享4.0國際許可提供的。
如果使用數據集,請引用為「Aligned ukiyo-e faces dataset, Justin Pinkney 2020」或一個bibtex條目:
@misc{pinkney2020ukiyoe, author = {Justin N. M. Pinkney}, title = {Aligned Ukiyo-e faces dataset}, year={2020}, howpublished= {\url{//www.justinpinkney.com/ukiyoe-dataset}} |
-
Pinkney, Justin N. M., and Doron Adler. 『Resolution Dependent GAN Interpolation for Controllable Image Synthesis Between Domains』. ArXiv:2010.05334 [Cs, Eess], 20 October 2020. //arxiv.org/abs/2010.05334.↩
-
為了生成此圖像,我首先使用在Imagenet上預訓練的ResNet50從每個圖像中提取CNN特徵。 然後使用UMAP將這些高維特徵向量投影到二維,然後使用lapjv算法完成網格劃分。
-
Wang, Xintao, Ke Yu, Shixiang Wu, Jinjin Gu, Yihao Liu, Chao Dong, Chen Change Loy, Yu Qiao, and Xiaoou Tang. 『ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks』. ArXiv:1809.00219 [Cs], 1 September 2018. //arxiv.org/abs/1809.00219.↩
-
Tian, Yingtao, Chikahiko Suzuki, Tarin Clanuwat, Mikel Bober-Irizar, Alex Lamb, and Asanobu Kitamoto. 『KaoKore: A Pre-Modern Japanese Art Facial Expression Dataset』. ArXiv:2002.08595 [Cs, Stat], 20 February 2020. //arxiv.org/abs/2002.08595.↩
AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平台,致力成為中國最大的科技創新人才聚集地。
如果,你也是位熱愛分享的AI愛好者。歡迎與譯站一起,學習新知,分享成長。