Unikalus Pandas Dataframe

Unikalus Pandas Dataframe



Populiariausia Python biblioteka, naudojama duomenų moksle, vadinama Pandas. Ji siūlo Python programuotojams didelio našumo, patogius naudoti ir duomenų analizės įrankius. Kai suprasite pagrindines funkcijas ir kaip jas naudoti, Pandas yra galingas įrankis duomenims keisti. „Pandose“ standartiniai duomenų saugojimo lentelėse metodai yra duomenų rėmeliai. Galime naudoti kai kuriuos „pandų“ metodus, kad gautume unikalias reikšmes „Panda“ duomenų rėmelio stulpelyje. Kai „DataFrame“ stulpeliuose turime gauti unikalių reikšmių ir nenorime, kad stulpelyje „DataFrame“ nepasikartotų reikšmės, galime naudoti „pandos“ numatytus metodus. Pažvelkime į tokius metodus šiame vadove kartu su kai kuriais pavyzdžiais ir išvestimi, kad gautume unikalias reikšmes DataFrame stulpelyje „pandos“.

Metodai, kaip gauti unikalias vertes „pandos“ DataFrame stulpeliuose

Galime naudoti du metodus, kad gautume unikalias reikšmes „pandos“ DataFrame stulpeliuose. Atsisakome pasikartojančių reikšmių ir gauname tik unikalias reikšmes DataFrames stulpeliuose. Metodai, kuriuos „pandos“ pateikia šiai užduočiai atlikti:







  • Naudodami unikalų () metodą.
  • Naudojant drop_dupliactes() metodą.

Dabar mes naudosime abu metodus „pandų“ koduose, kad gautume unikalias reikšmes „pandos“ DataFrame stulpeliuose.



Pavyzdys # 01

„Spyder“ programa čia naudojama šiems „pandų“ kodams generuoti, kad būtų naudojami metodai, kurie padeda mums gauti unikalias reikšmes „pandos“ DataFrame stulpeliuose. Prieš kurdami DataFrame, turime importuoti „pandos“ modulius, kurie yra būtini „pandos“ kodui. Naudodami terminą „importuoti“ ir įdėdami „pandas kaip pd“, importuojame šiuos modulius.



Dabar „pd“ pagalba galime greitai gauti „pandų“ funkcijas ar metodus. Tada įdedame „Subject_data“, kuriame pridedame „Vardas“, o į „Vardas“ pridedame vardo duomenis, kurie yra „Roman, William, Peter, Smith, John, Milli, Thomas ir James“. Tada į „Subj“ įtraukiame dalyko duomenis, kurie yra „Matematika, ekonomika, mokslas, matematika, statistika, statistika, statistika ir kompiuteris“. Tada mes konvertuojame šiuos 'Subject_data' į 'Subject_df' DataFrame naudodami 'pd.DataFrame()' metodą. Mes įdedame 'Subject_df' į 'print ()' metodą, kad jis būtų rodomas terminale.





Dabar norime gauti unikalias reikšmes „pandos“ DataFrame stulpelyje „Subj“. Šiuo tikslu mes naudojame „unique()“ metodą ir pridedame stulpelio pavadinimą bei duomenų rėmelio pavadinimą, kaip parodyta toliau. Pridedame šį metodą į 'print ()', todėl rezultatas taip pat bus rodomas terminale.



Dabar spaudžiame „Shift+Enter“, kad gautume šio kodo rezultatą, jis pateikiamas terminale ir taip pat rodomas čia, kuriame yra „DataFrame“ su visomis reikšmėmis. Tai yra originalus DataFrame, kurį įtraukėme į kodą ir po juo rodomos unikalios stulpelio „Subj“ reikšmės. Jis atmeta pasikartojančias reikšmes ir parodo unikalias DataFrame stulpelio „Subj“ reikšmes.

02 pavyzdys

Sukuriame sąrašą „Sample_list“, kuriame yra tam tikra informacija. Įterpiame „Layla, 21, 28, 31, 14 ir 39“, kuris bus rodomas kaip pirmasis stulpelis, kai konvertuosime šį sąrašą į „DataFrame“. Tada pridedame „Lusy, 31, 25, 34, 26 ir 21“ kaip antrą „DataFrame“ eilutę. Po to turime „Peteris, 38, 20, 20, 35 ir 24“ ir „Layla 38, 23, 39 24, 23“, kurios bus trečioji ir ketvirtoji „DataFrame“ eilutės. Taip pat įterpiame dar tris duomenis: „Stella, 21, 24, 24, 28, 31“, „Layla, 33, 32, 26, 30, 25“ ir taip pat „Petras, 21, 21, 31, 21, 29“ .

Dabar mes konvertuojame „Sample_list“ į „DF_Sample“, kuris yra DataFrame pavadinimas, įdėdami funkciją „pd.DataFrame()“. Be to, nustatome šio DataFrame stulpelių pavadinimus ir šie pavadinimai yra „Vardas, Ass_1, Ass_2, Ass_3, Ass_4 ir Ass_5“. Tada naudojame „print ()“, kuris padeda rodyti „DataFrame“ „DF_Sample“. Dabar šiame pavyzdyje naudojame kitą metodą, kad gautume unikalias reikšmes DataFrame stulpelyje. Šis metodas yra „pandos“ metodas „drop_duplicates()“.

Metodu „drop_duplicates()“ nustatome stulpelio, kuriame norime gauti unikalias DataFrame stulpelio reikšmes, pavadinimą. Mes gauname unikalias stulpelio „Vardas“ reikšmes, naudodami metodą „drop_duplicates()“ išmesdami pasikartojančias reikšmes šiame stulpelyje ir taip pat pateikdami šias unikalias reikšmes naudodami funkciją „print()“.

Pasikartojantys pavadinimai atmetami, o unikalios reikšmės pateikiamos pritaikius „drop_duplicates()“ metodą. Galite pastebėti, kad vardas „Layla“ rodomas trijose stulpelio „Vardas“ langeliuose. Bet kai šiam stulpeliui taikomas metodas „drop_duplicates()“, visos pasikartojančios reikšmės atmetamos ir ekrane pasirodo vienas „Layla“ pavadinimas. Atsisakius pasikartojančių reikšmių, atsirado naujas DataFrame, kuriame yra unikalios reikšmės šiame stulpelyje „Vardas“. Tokiu būdu mes galime atsisakyti pasikartojančių reikšmių ir gauti unikalią reikšmę DataFrame stulpelyje, naudodami metodą „drop_duplicates ()“.

03 pavyzdys

Vėl naudojamas tas pats „DataFrame“ ir dabar čia taikome „unikalų ()“ metodą. Naudodami „unique()“ metodą, pateikiame stulpelio pavadinimą ir „DataFrame“ pavadinimą, kuriam norime pritaikyti šį „unique()“ metodą, kad gautume unikalias reikšmes. Taip bus pateiktos tik unikalios to stulpelio reikšmės ir šios reikšmės nebus rodomos DataFrame forma.

Čia „DataFrame“ stulpelyje „Pavadinimas“ yra septynios reikšmės, tačiau kai šiam stulpeliui pritaikome „unique()“ metodą, atsirado tik keturios reikšmės ir tai yra unikalios to stulpelio reikšmės. Jis nepateikia pasikartojančių verčių.

04 pavyzdys

Šiame pavyzdyje sukurtas duomenų rėmelis yra „F_G_df“. Į šį duomenų rėmelį įterpiame „My_fruits“ ir „my_Vegs“. Stulpelyje „Mano_vaisiai“ yra „Obuolys, apelsinas, obuolys, kriaušė, ličiai, obuolys, obuolys, kriaušė ir obuolys“. Be to, turime „My_Vegs“, kuriame yra daržovių pavadinimai: „Cibli, Bringle“, Morkos, Bulvės, Bulvės, Morkos, Svogūnai, Česnakai ir Imbieras. Šiame duomenų rėmelyje yra tik du stulpeliai.

Dabar mes gauname unikalias vertes abiejuose stulpeliuose, naudodami metodą „unique()“. Mes minime DataFrame pavadinimą. Tada įveskite stulpelio pirmojo stulpelio pavadinimą. Po to mes naudojame metodą append (). Šiame priede vėl įdedame DataFrame pavadinimą ir antrojo stulpelio pavadinimą bei įdedame metodą „unique()“. Taip bus gautos unikalios abiejų stulpelių reikšmės, o tada pridėtos unikalios abiejų stulpelių reikšmės ir jos bus rodomos ekrane.

Pirmiausia pateikiamas duomenų rėmelis, kuriame yra visos reikšmės. Po to taikomas „unique()“ metodas ir žemiau pateikiamos unikalios abiejų stulpelių reikšmės. Šiame kode mes gauname unikalias reikšmes keliuose „DataFrame“ stulpeliuose, naudodami „unique()“ metodą.

Išvada

Išsamų paaiškinimą, kaip gauti unikalias reikšmes DataFrame stulpelyje, rasite šiame vadove. Aptarėme „unique()“ ir „drop_duplicates()“ metodus, kurie padeda mums gauti unikalias „DataFrame“ stulpelio reikšmes. Mes ištyrėme, kaip naudoti šiuos metodus „pandų“ kode, naudodami šiuos metodus mūsų koduose. Šiame vadove iliustravome skirtingus pavyzdžius ir parodėme, kaip gauti unikalias vieno stulpelio reikšmes naudojant „unique()“ ir „drop_duplicates()“ metodą. Taip pat ištyrėme, kaip gauti unikalias reikšmes keliuose stulpeliuose, naudojant šio vadovo metodą „unique()“.