CIFAR-10 Veri Seti
60000 adet 32x32 renkli görüntü içerir, 10 sınıfa ayrılmıştır.
50000 eğitim görüntüsü ve 10000 test görüntüsü bulunmaktadır.
Eğitim seti 5 parça, test seti 1 parçadan oluşmaktadır.
Sınıflar arasında örtüşme yoktur: otomobiller ve kamyonlar birbirinden ayrı tanımlanmıştır.
CIFAR-100 Veri Seti
CIFAR-100, CIFAR-10 gibi ama 100 sınıf ve her sınıfta 600 görüntü içerir.
Her sınıf için 500 eğitim ve 100 test görüntüsü bulunmaktadır.
Sınıflar 20 üst sınıfa (superclass) ayrılmıştır.
Her görüntü, ince (fine) ve kaba (coarse) etiket içerir.
Veri Seti İndirme Seçenekleri
Her iki veri setinin Python, Matlab ve ikili sürümleri mevcuttur.
CIFAR-10 ve CIFAR-100 için dosya boyutları sırasıyla 163 MB ve 161 MB’dır.
Veri setini kullanmak isteyenler, belirli bir teknik raporu alıntı yapmalıdır.
Temel Sonuçlar
CUDA konvolüsyon ağı kullanılarak elde edilen temel sonuçlar: veri artırımı olmadan %18 test hatası, veri artırımı ile %11 test hatası.
Bayes hiperparametre optimizasyonu ile elde edilen %15 test hata oranı, ilginç bir başarıdır.
Veri Seti Yapısı
Python ve Matlab versiyonu, CIFAR-10 ile aynı yapıya sahiptir.
Veri dosyaları, görüntülerin ve etiketlerin yer aldığı Python 'pickled' nesneleri içerir.
İkili versiyon ise her görüntü için bir etiket ve piksel verisi içerir, 3073 baytlık sırayla düzenlenmiştir.