全網最全開源工業缺陷數據集匯總(已更新24個)
本文目前匯總了常見的24個開源工業缺陷數據集,持續更新中
(歡迎大家留言補充,共同建設一個為大家提供便利的文章)
1、東北大學熱軋帶鋼表面缺陷數據集
該數據集是東北大學的宋克臣等幾位老師收集的,一共包含了三類數據,官網有時打不開,三種缺陷數據集我都我保存到了百度網盤裡
百度網盤鏈接:
提取碼:ibje
(1)NEU surface defect database
數據集收集了夾雜、劃痕、壓入氧化皮、裂紋、麻點和斑塊6種缺陷,每種缺陷300張,圖像尺寸為200×200。數據集包括分類和目標檢測兩部分,不過目標檢測的標註中有少量錯誤,需要注意。部分示例如下:

(2)Micro surface defect database
微小型的帶鋼缺陷數據,缺陷只有約6×6個像素大小

(3)Oil pollution defect database
油污干擾的硅鋼表面缺陷數據集

2、Kaggle中謝韋爾鋼鐵公司提供的帶鋼缺陷數據集
該數據集中提供了四種類型的帶鋼表面缺陷。訓練集共有12568張,測試集5506張。圖像尺寸為1600×256。

謝韋爾帶鋼缺陷數據集
有如果有學術研究的需要,可以無限制使用,請將PAO Severstal(//www.severstal.com/)指定為數據集所有者。
本來想傳到百度網盤供大家下載的,奈何500個文件以上需要超級會員。。。上萬張圖片,數量實在是太多了,沒法手動上傳。
3、UCI Steel Plates Faults Data Set
該數據集包含了7種帶鋼缺陷類型。這個數據集不是圖像數據,而是帶鋼缺陷的28種特徵數據,可用於機器學習項目。

百度網盤鏈接:
提取碼:9uv2
4、DAGM 2007數據集
該數據集是人為生成的,一共包含了10個class,圖像大小為512×512。該數據集為部分示例如下:

百度網盤鏈接:
提取碼:j9qz
5、磁瓦缺陷數據集
中國科學院自動所一個課題組收集的數據集,是「Saliency of magnetic tile surface defects」這篇論文的數據集。收集了6種常見磁瓦缺陷的圖像,並做了語義分割的標註。

百度網盤鏈接:
提取碼:ky8i
6、Kolektor 表面缺陷數據集
該數據集是Kolektor Group收集並標註的電子換向器缺陷數據集。數據集中包含了50種編寫的電子換向器,每種有8張圖片以及其語義分割的label。圖像的大小為500×1240像素。為了更方便的訓練,需提前將圖像調整為512×1408。

百度網盤鏈接:
提取碼:1zlb
7、鐵軌表面缺陷數據集
RSDDs數據集包含兩種類型的數據集:第一種是從快車道捕獲的I型RSDDs數據集,其中包含67個具有挑戰性的圖像。第二個是從普通/重型運輸軌道捕獲的II型RSDDs數據集,其中包含128個具有挑戰性的圖像。
兩個數據集的每幅圖像至少包含一個缺陷,並且背景複雜且噪聲很大。
RSDDs數據集中的這些缺陷已由一些專業的人類觀察員在軌道表面檢查領域進行了標記。

百度網盤鏈接:
提取碼:nanr
8、水泥道路裂縫數據集
主要針對水泥路面的裂縫檢測,可用於分類、分割和Detection

百度網盤鏈接:
提取碼:7nzx
9、橋樑裂縫圖像數據
橋樑裂縫的檢測數據:

百度網盤鏈接:
提取碼:z493
10、混凝土表面裂紋缺陷數據集
數據集包含帶有和不帶有裂紋的各種混凝土表面的圖像。 圖像數據在單獨的文件夾中分為負片(無裂紋)和正片(無裂紋)兩部分,用於圖像分類。 每個類別有20000張圖像,總共40000張圖像,帶227 x 227像素的RGB通道。

11、天池鋁型材表面缺陷數據集
2018年阿里天池大賽,廣東工業智造大數據創新大賽—智能算法賽中提供的數據集。

百度網盤鏈接:
提取碼:i10s
12、天池紡織品表面異常數據集
在布匹的實際生產過程中,由於各方面因素的影響,會產生污漬、破洞、毛粒等瑕疵,為保證產品質量,需要對布匹進行瑕疵檢測。布匹疵點檢驗是紡織行業生產和質量管理的重要環節,目前人工檢測易受主觀因素影響,缺乏一致性;並且檢測人員在強光下長時間工作對視力影響極大。由於布匹疵點種類繁多、形態變化多樣、觀察識別難道大,導致布匹疵點智能檢測是困擾行業多年的技術瓶頸。本數據涵蓋了紡織業中布匹的各類重要瑕疵,每張圖片含一個或多種瑕疵。數據包括包括素色布和花色布兩類,其中,素色布數據約8000張,用於初賽;花色布數據約12000張,用於複賽。
百度網盤鏈接:
提取碼:2j46
複製這段內容後打開百度網盤手機App,操作更方便哦
13、KTH-TIPS database
瑞典皇家理工學院提供的背景紋理數據集,類型包括砂紙、鋁箔、發泡膠、海綿、燈芯絨、亞麻、棉、黑麵包、橙皮和餅乾共10類。

百度網盤鏈接:
提取碼:am65
14、印刷電路板(PCB)瑕疵數據集
這是一個公共的合成PCB數據集,由北京大學發佈,其中包含1386張圖像以及6種缺陷(缺失孔,鼠標咬傷,開路,短路,雜散,偽銅),用於檢測,分類和配准任務。

官方鏈接:北京大學智能機械人開放實驗室
15、AITEX數據集
該數據庫由七個不同織物結構的245張4096 x 256像素圖像組成。數據庫中有140個無缺陷圖像,每種類型的織物20個,除此之外,有105幅紡織行業中常見的不同類型的織物缺陷(12種缺陷)圖像。圖像的大尺寸允許用戶使用不同的窗口尺寸,從而增加了樣本數量。Internet上的數據庫還包含所有具有缺陷的圖像的分割mask,使得白色像素表示缺陷區域,其餘像素為黑色。

官方鏈接://www.aitex.es/afid/
百度網盤鏈接:
提取碼:z9yc
16、Kylberg Texture Dataset v. 1.0
28種紋理圖像,每一種有160個獨特的紋理。圖像大小為576×576像素。

17、輸電線路絕緣子數據集
數據集中,Normal_Insulators包含由無人機捕獲的絕緣子圖像,數量為600張。
Defective_Insulators包含有缺陷的絕緣體,絕緣子缺陷圖像的數量為248張。
數據集中包括數據集和標籤。

18、百度AI Studio中的數據集
百度AI Studio中有很多的數據集,可以直接去搜索
Baidu AI Studio – 人工智能學習與實訓社區

例如:
布匹缺陷數據集:布匹缺陷數據集:
瓷磚缺陷數據集:瓷磚缺陷數據集
絕緣子自爆缺陷圖像:絕緣子自爆缺陷圖像
工業缺陷檢測:工業缺陷檢測
PCB缺陷檢測:PCB缺陷檢測
手扶電梯梯級缺陷:手扶電梯梯級缺陷
19、CV Datasets on the web
匯總了CV領域的常見數據集,與工業缺陷的關係不大。
歡迎大家留言補充,共同建設一個為大家提供便利的文章。