■CIFAR(Canadian Institute For Advanced Research)-10とは
CIFAR-10とはAlex Krizhevsky氏らが収集した動物や乗り物の画像を集めたデータセットのことで、ニューラルネットワークの画像認識用データなどに用いられます。
トレーニングデータとして50,000個、テストデータとして10,000個の画像データがあります。データはpytorchやsklearn、kerasなどからも入手可能ですが、ファイルサイズが大きいからか、ダウンロードエラーになることがあるので、
以下サイトから入手するのが確実です。
import numpy as np
import matplotlib.pyplot as plt
import pickle
with open("data_batch_2", 'rb') as file: # open:ファイルを開く
a = pickle.load(file, encoding='bytes') # pickle:データをロードする。aはdict型
b = a[b'data'][0] # bは3072個のデータ(3*32*32)
c = b.reshape(3, 32, 32).transpose(1,2,0) # [32,32,3]に変換