Pandos serija į CSV

Pandos Serija I Csv



Metodas „Series.to_csv()“ programoje Pandas išveda nurodytą serijos objektą kableliais atskirtų reikšmių (csv) užrašu. Ši funkcija tiesiog paima reikšmes iš serijos ir pakeičia jų formatą pridėdama kablelius, kad atskirtų indekso ir stulpelio reikšmes.

Norėdami naudoti šią funkciją, turime naudoti šią sintaksę:









Šiame straipsnyje bus pateikti du skirtingi būdai, kaip išmokti naudoti šį metodą python programoje.



1 pavyzdys: Series.to_csv() metodo naudojimas norint konvertuoti seriją su DatetimeIndex į kableliais atskirtas reikšmes

Norėdami modifikuoti seriją į CSV formatą, naudosime funkciją „Series.to_csv()“. Ši iliustracija sugeneruos seriją su DatetimeIndex ir konvertuos ją į kableliais atskirtų reikšmių formatą.





Norėdami pritaikyti šį metodą, turime turėti įrankį, palaikantį python programavimą. Kodams sudaryti pasirinktas įrankis „Spyder“. Norėdami ant jo parašyti scenarijų, pirmiausia paleidome įdiegtą įrankį savo sistemoje. Python programai reikalinga biblioteka, kad ji galėtų panaudoti savo metodus norimam rezultatui pasiekti. Biblioteka, kurią čia įkėlėme, yra „Pandas“. Toje pačioje kodo eilutėje šios bibliotekos slapyvardis identifikuojamas kaip „pd“. Taigi, bet kurioje programos vietoje, norėdami pasiekti funkciją, turime parašyti „pandas“. Vietoj to parašytume „pd“.

Pirmasis žingsnis pradedant nuo kodo yra sukurti Pandas seriją. Turime parašyti „pd“, kad panaudotume serijos kūrimo metodą iš pandų. Funkcija „pd.Series()“ iškviečiama sukurti seriją su nurodytomis reikšmėmis. Vertybės, kurias suteikėme serialams: „Stambulas“, „Izmiras“, „Ankara“, „Ankara“, „Antalija“, „Konya“ ir „Bursa“. Jei norite pavadinti šį reikšmių masyvą, tai galite padaryti naudodami parametrą „name“. Čia mes pavadinome šią vertybių masyvą „Miestai“, nes jame yra 6 miestų pavadinimai. Šiai serijai saugoti buvo sukurtas serijos objektas „Turkija“.



Norėdami sukurti DatetimeIndex, mes panaudojome metodą 'pd.date_range()'. Tarp šios funkcijos skliaustų pateikėme 4 argumentus, kurie yra: „pradžia“, „dažnis“, „taškai“ ir „tz“.

Argumentui „pradžia“ reikia datos ir laiko, kad iš jo būtų pradėta generuoti dienų seka. Čia mes nurodėme pradžios datą ir laiką kaip „2022-03-02 02:30“. Parametras „freq“ klasifikuoja dienų sekos dažnį. Taigi, mes suteikėme jam reikšmę „D“. Dabar bus sukurta dienų seka kasdieniam dažnumui. Argumentas „laikotarpis“ nustatytas į „6“, o tai reiškia, kad bus sukurta 6 dienų dienų seka. Paskutinis parametras yra „tz“, kuris nurodo nurodytos srities laiko juostą. Nurodėme laiko juostą „Asia/Stambul“.

Norėdami išsaugoti šią dienų seką, sukūrėme kintamąjį „Datetime“ kintamąjį. Norėdami nustatyti DatetimeIndex, panaudojome ypatybę „Series.index“. Serijos pavadinimas „Turkey“ pateikiamas kartu su ypatybe „.index“ ir jai priskiriamas datos laiko intervalas, saugomas „Datetime“ kintamajame. Taigi, ypatybė „indeksas“ paims reikšmes iš „Datatime“ kintamojo ir padarys jas serijos „Turkija“ indekso sąrašu. Galiausiai, norėdami peržiūrėti išvesties serijas, panaudojome „print()“ metodą ir perdavėme seriją „Turkey“ kaip įvestį, kad būtų rodomas jos turinys.

Norėdami vykdyti scenarijų, tiesiog paspaudėme parinktį „Vykdyti failą“. Todėl galime matyti seriją su DatetimeIndex, pradedant nuo „2022-03-02 02:30:00+03:00“ ir baigiant „2022-03-07 02:30:00+03:00“, sukuriant laikotarpį iš 6 dienų. Po serija taip pat minimas „Freq :D“, masyvo sąrašo pavadinimas „Cities“ ir dtype „objektas“.

Dabar išmoksime konvertuoti šią seriją, kurią ką tik matėme aukščiau esančioje nuotraukoje, į CSV formatą. Norėdami modifikuoti serijas į kableliais atskirtas reikšmes, turime metodą, kurį pateikia modulis „pandas“, kuris yra „Series.to_csv()“. Šis metodas paima pateiktų serijų reikšmes ir tarp stulpelio verčių prideda kablelius.

Iškviečiama funkcija „Series.to_csv()“. Serijos, kurią norime konvertuoti, pavadinimas minimas naudojant metodą „Turkey.to_csv()“. Norėdami išsaugoti kableliais atskirtas reikšmes, sukūrėme kintamąjį „Comma_Separated“ ir įtraukėme jo turinį į išvesties langą, iškviesdami funkciją „print()“.

Štai mūsų serija csv formatu. Momentinėje nuotraukoje matome, kad indekso ir serijų reikšmės buvo atskirtos jose kableliais.

2 pavyzdys: Series.to_csv() metodo naudojimas norint konvertuoti seriją su NaN reikšmėmis į kableliais atskirtas reikšmes

Antrasis metodas, skirtas naudoti „Series.to_csv()“ metodą, yra šio metodo taikymas, norint konvertuoti seriją, kurioje yra keletas nulinių įrašų, į CSV formatą.

Iš pradžių importavome reikiamas pakuotes. „Pd“ yra pandų slapyvardis, o „np“ – kaip numpy slapyvardis. Numpy įrankių rinkinys įkeliamas čia, nes mes padarysime keletą nulinių įrašų savo serijoje naudodami „np.NaN“, kurdami ją naudodami pandos „pd.Series()“ metodą.

Funkcija „pd.Series()“ iškviečiama kuriant pandų seriją su šiomis reikšmėmis: „Nile“, „Amazon“, np.NaN, „Ganges“, „Misisipė“, „np.NaN“, „Yangtze“, „Dunojus“, „Mekong“, „np.NaN“ ir „Volga“. Iš viso yra apibrėžta 21 serijos vertė, iš kurių 3 įrašuose yra „np.NaN“ reikšmės, o tai reiškia, kad serijoje trūksta 3 reikšmių. Ypatybė „pavadinimas“ nurodo šio reikšmių masyvo pavadinimą, kurį pateikėme „Pavadinimai“. Ypatybė „indeksas“ naudojama norint nustatyti vartotojo nustatytą indekso sąrašą, o ne naudoti numatytąjį sąrašą.

Čia norime indekso sąrašo su reikšmėmis „10“, „11“, „12“, „13“, „14“, „16“, „17“, „18“, „19“, „20“, ir 21“. Dabar mūsų serijos rodyklės sąrašas prasideda nuo „10“, o ne „0“. Dabar išsaugokite šią seriją, kad galėtume ją naudoti vėliau programoje. Mes inicijavome serijos objektą „Rivers“ ir paskirstome jam išvesties serijas, sugeneruotas iškvietus „pd.Series()“ metodą. Serija gali būti matoma išleidus ją ekrane naudojant python funkciją „print()“.

Pateikta išvestis terminale išspausdino seriją, kurios indeksų sąrašas prasideda nuo 10 ir baigiasi 21, o tai reiškia, kad serijoje yra 21 reikšmė.

Serija bus paversta CSV formatu naudojant „Series.to_csv()“ metodą.

Savo serijoje „Turkija“ panaudojome metodą „Series.to_csv()“. Taigi šis metodas paims reikšmes iš serijos „Turkija“ ir konvertuos jas į kableliais atskirtų reikšmių formatą. Rezultatas išsaugomas kintamajame „Converted_csv“. Ir galiausiai konvertuotos serijos spausdinamos naudojant funkciją „print()“.

Toliau pateiktoje rezultato nuotraukoje matote, kad dabar serijos reikšmės yra pakeistos taip, kad jas atskiriant nuo indekso sąrašo naudojamas kablelis. Be to, kai trūksta reikšmių, kableliu spausdinamas tik indekso numeris.

Išvada

Pandų serijos modifikavimas į CSV formatą yra praktiškas būdas. Tai galima pasiekti naudojant pandos funkciją „Series.to_csv()“. Šiame vadove praktikoje pateikiami du šio metodo naudojimo būdai. Pirmoje iliustracijoje mes panaudojome šį metodą, norėdami konvertuoti seriją su DatetimeIndex į kableliais atskirtų reikšmių formatą. 2-asis pavyzdys naudojo funkciją „Series.to_csv()“  , kad pakeistų seriją su kai kuriais trūkstamais įrašais į CSV formatą. Abu metodai buvo praktiškai įgyvendinti naudojant „Spyder“ įrankį „Windows“ operacinėje sistemoje.