SVHN數據集 Format1 剪裁版

SVHN數據集官網://ufldl.stanford.edu/housenumbers/

SVHN數據集官方提供的有兩種格式
Format1是那種在街上拍的照片,每張照片的尺寸都不同,然後label提供了照片上門牌上的所有數字,和每一個單獨的數字的bounding box;
在這裡插入圖片描述

Format2是把街拍圖片上的數字一個一個截出來,然後resize成32*32的圖片,label是一個單獨的數字。
在這裡插入圖片描述

官方的Format2特別好讀,numpy矩陣啥的官方都給了,網上教程也一大堆。但是Format1不太好讀,我整了一下午,整了一個從bounding box剪出來的,多數字的版本,這裡給大家提供一個開箱即用的預處理過的好讀的格式發出來。

input和label如下

input:
在這裡插入圖片描述
label:[2, [2, 3]]

使用方法

import pickle

# 讀取數據
f = open('train-set.blob', 'rb')
x_train_set, y_train_set = pickle.load(f)
f.close()

f = open('test-set.blob', 'rb')
x_test_set, y_test_set = pickle.load(f)
f.close()

# 展示圖片和對應標籤
from PIL import Image
index = 666
im = Image.fromarray(x_train_set[i].reshape(64,64,3))
im.show()
print(y_train_set[i])

數據格式

x_XXX_set::一個列表,列表中每個元素是一個numpy數組,表示一張圖片,數組的尺寸是3*64*64,表示(通道,高度,寬度)。這個numpy數組的dtype為uint8,範圍在0-255之間。通道有三個,意思是RGB的,具體哪個是R哪個是G哪個是B我就沒管了

y_XXX_set:一個列表,列表中每個元素是一個列表,對應一張圖片的label。這個小列表的格式為[數字的數量, [第一個數字,第二個數字,…]],列表中數字的數據類型都是python中的內置的int數據類型。

在原數據集中,圖片上的0用「10」來標註。在我們這個版本里做出了修改,0就是用0標註。也就是0-9的正常標註。

下載地址:

有csdn積分的哥們施捨一下://download.csdn.net/download/qq_39480548/15617097

實在沒積分的哥們咱也不能一棒子打死://pan.baidu.com/s/1jgc3-iQjMeDO30mhe8WGmQ 提取碼: h9p3