Kaip kartoti ir vizualizuoti duomenų rinkinį naudojant „PyTorch“?

Kaip Kartoti Ir Vizualizuoti Duomenu Rinkini Naudojant Pytorch



PyTorch yra gilaus mokymosi sistema, leidžianti vartotojams kurti / kurti ir mokyti neuroninius tinklus. Duomenų rinkinys yra duomenų struktūra, kurioje yra duomenų pavyzdžių ir etikečių rinkinys / rinkinys. Tai suteikia galimybę pasiekti visus duomenis arba naudoti indeksavimo ir pjaustymo operacijas. Be to, duomenų rinkinys taip pat gali pritaikyti duomenų transformacijas, pvz., apkarpyti, keisti dydį ir pan. Vartotojai gali lengvai kartoti ir vizualizuoti duomenų rinkinį PyTorch.

Šis įrašas parodys metodą, kaip kartoti ir vizualizuoti konkretų duomenų rinkinį naudojant PyTorch.







Kaip kartoti ir vizualizuoti duomenų rinkinį naudojant „PyTorch“?

Norėdami pakartoti ir vizualizuoti tam tikrą duomenų rinkinį naudodami PyTorch, atlikite nurodytus veiksmus:



1 veiksmas: importuokite būtiną biblioteką



Pirmiausia importuokite reikiamas bibliotekas. Pavyzdžiui, importavome šias bibliotekas:





importo žibintuvėlis
iš torch.utils.data importuoti duomenų rinkinį
iš „torchvision“ importo duomenų rinkinių
iš torchvision.transforms import ToTensor
importuoti matplotlib.pyplot kaip plt


Čia:

    • importo žibintuvėlis “ importuoja PyTorch biblioteką.
    • iš torch.utils.data importuoti duomenų rinkinį “ importuoja „Dataset“ klasę iš „PyTorch“ modulio „torch.utils.data“, kad sukurtų pasirinktinius duomenų rinkinius „PyTorch“.
    • iš „torchvision“ importo duomenų rinkinių “ importuoja „duomenų rinkinių“ modulį iš „torchvision“ bibliotekos, kurioje pateikiami iš anksto nustatyti duomenų rinkiniai kompiuterinės vizijos užduotims.
    • iš torchvision.transforms import ToTensor “ importuoja „ToTensor“ transformaciją iš „torchvision.transforms“, skirtą PIL vaizdams arba „NumPy“ masyvams konvertuoti į „PyTorch“ tenzorius.
    • importuoti matplotlib.pyplot kaip plt “ importuoja matplotlib biblioteką duomenų vizualizavimui:


2 veiksmas: įkelkite duomenų rinkinį



Dabar mes įkelsime FashionMNIST duomenų rinkinį iš „torchvision“ tiek mokymo, tiek testavimo tikslais su šiais parametrais:

tr_data = duomenų rinkiniai.FashionMNIST ( šaknis = 'duomenys' , traukinys = Tiesa, parsisiųsti = Tiesa, transformuoti =ToTensor ( )
)

ts_data = duomenų rinkiniai.FashionMNIST ( šaknis = 'duomenys' , traukinys = Netiesa, parsisiųsti = Tiesa, transformuoti =ToTensor ( )
)


Čia:

    • FashionMNIST “ įkelia FashionMNIST duomenų rinkinį iš torchvision bibliotekos.
    • root = 'duomenys' “ nurodo katalogą, kuriame bus saugomas arba įkeliamas duomenų rinkinys, jei jis jau yra. Mūsų atveju tai yra „duomenų“ katalogas.
    • traukinys “ nurodo mokymo arba bandymo duomenų rinkinį.
    • download=Tiesa “ atsisiunčia duomenų rinkinį, jei jo dar nėra.
    • transform=ToTensor() “ taiko ToTensor transformaciją, kad duomenų rinkinio vaizdai konvertuotų į PyTorch tenzorius:


3 veiksmas: pažymėkite klases duomenų rinkinyje

Tada sukurkite žodyną, susiejantį klasių indeksus su atitinkamomis klasių etiketėmis FashionMNIST duomenų rinkinyje. Kiekvienai klasei pateikiamos žmonėms suprantamos etiketės. Čia mes sukūrėme „ mappped_label “ žodyną ir mes naudosime tai norėdami konvertuoti klasių indeksus į atitinkamas klasių etiketes:

mappped_label = {
0 : 'Marškinėliai' ,
1 : 'Kelnės' ,
2 : 'Pulioveris' ,
3 : 'Suknelė' ,
4 : 'paltas' ,
5 : 'Sandalas' ,
6 : 'Marškiniai' ,
7 : 'Sneaker' ,
8 : 'Maišas' ,
9 : 'Bulzinis batas' ,
}



4 veiksmas: vizualizuokite duomenų rinkinį

Galiausiai vizualizuokite treniruočių duomenų pavyzdžius naudodami „matplotlib“ biblioteką:

pav = plt.figūra ( figos dydis = ( 8 , 8 ) )
plk , eilutė = 3 , 3
dėl i in diapazonas ( 1 , plk * eilutė + 1 ) :
sample_index = torch.randint ( tik ( tr_date ) , dydis = ( 1 , ) ) .elementas ( )
img, etiketė = tr_duomenys [ pavyzdys_indeksas ]
fig.add_subplot ( eilė, plk , i )
plt.title ( mappped_label [ etiketė ] )
plt.axis ( 'išjungta' )
plt.imshow ( img.suspausti ( ) , cmap = 'pilka' )
plt.show ( )





Pastaba : „Google Colab“ bloknotą galite pasiekti šiuo adresu nuoroda .

Tai buvo viskas apie norimo duomenų rinkinio kartojimą ir vizualizavimą naudojant PyTorch.

Išvada

Norėdami pakartoti ir vizualizuoti tam tikrą duomenų rinkinį naudodami PyTorch, pirmiausia importuokite reikiamas bibliotekas. Tada įkelkite norimą duomenų rinkinį mokymui ir testavimui su reikiamais parametrais. Tada pažymėkite klases duomenų rinkinyje ir vizualizuokite mokymo duomenų pavyzdžius naudodami „matplotlib“ biblioteką. Šis įrašas iliustruoja konkretaus duomenų rinkinio kartojimo ir vizualizavimo metodą naudojant PyTorch.