Pandas DataFrame į JSON

Pandas Dataframe I Json



„Pandos“ suteikia galimybę manipuliuoti duomenimis ir analizuoti duomenis. Šiuolaikiniame pasaulyje duomenų analizė yra nepaprastai vertinga priemonė. Norint atlikti šią užduotį, kompiuterių moksle yra įvairių duomenų struktūrų. „Pandose“ turime „DataFrame“, kuris taip pat konvertuojamas į „JSON“. Galime paaiškinti „JSON“, nes tai yra tekstas, kuriame naudojami „JavaScript“ objektų žymėjimai. Duomenų perdavimui tarp serverių ir žiniatinklio programų naudojamas „JSON“. Šiame vadove išnagrinėsime „DataFrames“ JSON formato konvertavimą. Šiam konvertavimui iš „DataFrame“ į „Json“, „pandas“ pateikia metodą „to_json()“. Kai reikia konvertuoti „DataFrame“ į „JSON“ formatą, naudojame „pandos“ metodą „to_json()“. Norėdami geriau suprasti, kaip panaudoti „pandos“ funkciją, kuri yra „to_json“, pažvelkime į keletą „pandų“ kodų šiame vadove.

01 pavyzdys
Praktiškai parodysime, kaip panaudoti „pandos“ metodą „to_json()“, kad „pandos“ duomenų rėmelis būtų pakeistas į JSON formatą. Čia importuojamas „pandų“ paketas, kuris yra „numpy“, o mes jį importuojame kaip „np“. Dabar, norint vykdyti „pandos“ kodą, reikia importuoti pandos paketus. Norėdami importuoti šį paketą, naudojame raktinį žodį „importuoti“. Tada mes nustatome „pandas kaip pd“, o tai reiškia, kad galime lengvai pasiekti arba naudoti bet kurį mums reikalingą „pandų paketą“, tiesiog įdėję ten „pd“.

Čia sukuriame numpy masyvą, naudodami „np. masyvas“, šis „np“ padeda mums pasiekti niūrias bibliotekos funkcijas. Šis neryškus masyvas taip pat saugomas kintamajame „New_data“, o į šį neryškų masyvą įtraukiame „A, B, C, D“ ir „E, F, G, H“. Šis neryškus masyvas dabar konvertuojamas į DataFrame, naudojant „pd.DataFrame“ metodą. Tai yra „pandos“ metodas, kurį pasiekiame įdėję „pd“. Kai konvertuojame šį neryškų masyvą į DataFrame, taip pat įtraukiame stulpelių pavadinimus.







Vardai, kuriuos čia pridedame kaip stulpelių antraštes, yra „col1, col2, col3 ir col4“. Tada pamatysite, kad žemiau yra „spausdinimas“, kuriame nustatome duomenų rėmelio pavadinimą, kuris šiuo atveju yra „New_dataFrame“, todėl jis bus pateiktas vykdant šį kodą. Dabar mes konvertuojame šį „DataFrame“ į JSON formatą naudodami „to_json()“ metodą. „DataFrame“ pavadinimą „New_dataFrame“ nustatome naudodami metodą „to_json()“, taip pat įtraukiame šį metodą į „New_json“ kintamąjį. Čia mes neperdavėme jokio parametro šiam metodui „to_json ()“. „DataFrame“ JSON formatas dabar įtrauktas į „spausdinimą“ ir jis taip pat bus pateiktas konsolėje.





Norėdami sudaryti ir vykdyti šį kodą, paspaudžiame „Shift+Enter“ ir jei kodas be klaidų, išvestis bus pateikta. Čia taip pat įklijuojame šio kodo rezultatą, kuriame parodėme šiame pavyzdyje sukurtą duomenų rėmelį, taip pat to DataFrame JSON formatą.





02 pavyzdys
Čia importuojame tik vieną biblioteką, tai yra „pandos“, tada sukuriamas sąrašas „AtoZ_Courses“ ir į jį įdedame keletą sąrašų, kurie yra „Python, 29000, 35 days ir 1000.0“, tada įdedame „ JavaScript, 27000, 55 dienos ir 2300.0“, po to pridedame „HTMLCSS, 25000, 25 dienos ir 1500.0“. Dabar taip pat įterpėme dar du duomenis: „DataBase, 24000, 45 days ir 1500.0“ ir „OOP, 21000, 35 days, 1500.0“. „AtoZ_Courses“ sąrašas dabar pakeistas „DataFrame“ ir pavadinome jį „AtoZ_Courses_df“. „Kursų_pavadinimas, mokėjimas, trukmė ir premija“ čia pridedami kaip „DataFrame“ stulpelių pavadinimai.



Dabar šiame veiksme sugeneruojamas „DataFrame“ ir mes įtraukiame jį į „print ()“ teiginį, kad būtų rodomas terminale. Dabar, naudodami metodą „to_json()“, „AtoZ_Courses_df“ duomenų rėmelį paverčiame JSON formatu. Šiam „to_json()“ metodui taip pat suteikiamas parametras, kuris yra „orient= column“, kuris taip pat yra numatytasis parametras. „DataFrame“ rodomas kaip „{stulpelio pavadinimas -> {indekso vertė -> stulpelio vertė}} formatas“.

Čia JSON formatu rodomas stulpelio pavadinimas, o tada pateikiamos visos to stulpelio reikšmės kartu su indekso reikšme. Pirma, jis pamini pirmojo stulpelio pavadinimą, tada visos pirmojo stulpelio reikšmės pateikiamos kartu su indekso reikšmėmis, o tada pateikia antrojo stulpelio pavadinimą, taip pat visas antrojo stulpelio reikšmes su indeksais ir pan.

03 pavyzdys
DataFrame generuojamas šiame kode pavadinimu „Bachelors_df“. Į šį „Bachelors_df“ įterpėme penkis stulpelius. Pirmasis stulpelis, kurį turime čia, yra „Studentas“, į jį įterpiame „Lily, Smith, Bromley, Milli ir Alexander“. Kitas stulpelis yra stulpelis „Laipsnis“, kuriame yra „IT, BBA, anglų kalba, CS ir DVM“. Tada ateina į priekį „year_of_ining“, kur pridedame studentų prisijungimo metus, kurie yra „2015, 2018, 2017, 2015 ir 2014“.

Stulpelis šalia šio stulpelio yra „year_of_graduation“, kuriame yra šių studentų baigimo metai yra „2019, 2022, 2021, 2019 ir 2018“. Čia taip pat pridedame stulpelį „CGPA“, kuriame pateikiame studentų CGPA „3.3, 3.5, 3.6, 3.7 ir 3.8“. Norėdami terminale rodyti „Bachelors_df“, įtraukiame jį į „print()“ išraišką. Dabar „Bachelors_df“ duomenų rėmelį konvertuojame į JSON formatą naudodami metodą „to_json()“.

Parametras „orient= records“ taip pat perduodamas šiam „to_json()“ metodui šiame kode. Šis „orient= records“ parodys JSON formatą kaip „[{stulpelio pavadinimas -> stulpelio vertė}, … , {stulpelio pavadinimas -> stulpelio vertė}]“. „DataFrame“ JSON formatas dabar nustatytas į „spausdinti“ ir jis taip pat bus rodomas terminale.

DataFrame čia tiesiog rodomas stulpelių ir eilučių formoje, tačiau JSON formatu galite pastebėti, kad jis pateikia stulpelio pavadinimą ir tada rodo to stulpelio reikšmę; parodžius vieno stulpelio reikšmę, atspausdina antrojo stulpelio pavadinimą, tada įdeda to stulpelio reikšmę ir taip toliau, nes 'to_josn' metodo parametrą nustatome kaip 'orient= records'.

04 pavyzdys
Sukuriame neryškų masyvą „My_data“, kuriame įterpiame „2, 4“ ir „6, 8“. Tada pakeiskite numpy masyvą į DataFrame 'My_dataFrame' ir nustatykite jo stulpelių pavadinimus kaip 'A1 ir A2'. Dabar, kai čia rodomas DataFrame naudojant „spausdinti“. Pirmiausia naudojame metodą „to_json()“ be jokių parametrų ir jį rodome. Po to nustatome metodų „to_json()“ parametrą į „orient=split“ ir taip pat išspausdiname šį formatą. Tada „My_dataFrame“ vėl pritaikome „to_josn()“ ir šį kartą perduodame „orient=records“ kaip šios funkcijos parametrą.

Žemiau pateikiame „orient= index“ su „My_dataFrame“ ir pateikiame šį JSON formatą. Po šio parametro vėl naudojame „to_json“ su parametru „orient = column“ ir taip pat pateikiame jį. Tada perduodame „orient= value“ kaip „to_json()“ metodo parametrą ir taikome jį „My_dataFrame“. Taip pat nustatome šios funkcijos parametrą į „orient= table“ ir vėl naudojame su tuo pačiu „DataFrame“ ir taip pat rodome šį JSON formatą. Dabar atkreipsime dėmesį į skirtumą tarp JSON formatų šio kodo išvestyje.

Čia galite lengvai rasti skirtumą tarp JSON formatų, kuriuos pritaikėme tam pačiam DataFrame. Visi parametrai, kuriuos perdavėme metodu „to_json“, čia rodomi skirtingais formatais.

Išvada

Šiame vadove parodytas JSON formatas ir išsamiai paaiškintas šis JSON formatas bei kaip konvertuoti pandas DataFrame į JSON. Paaiškinome, kad Pandas DataFrame konvertavimui į JSON formatą naudojamas metodas „to_json()“. Taip pat aptarėme skirtingus parametrus, kuriuos čia perdavėme metodui „to_json()“. Pateikėme išsamų vadovą, kuriame panaudojome „to_json()“ metodus, įtraukdami visus įmanomus šio „to_json()“ metodo parametrus „pandos“ kode, taip pat išvestyje parodėme, kaip šie parametrai keičia formatą. JSON.