Pandos sumos stulpelis

Pandos Sumos Stulpelis



„Šiame straipsnyje bus parodyta, kaip susumuoti visus arba tam tikrus Pandas DataFrame stulpelius naudojant Python. Funkcija DataFrame.sum() bus naudojama kartu su keliais naudingais parametrais daugelyje šios pamokos pavyzdžių.

Kai ši mokymo programa baigsis, galbūt žinosite, kaip:







    • Raskite Pandos duomenų rėmelio stulpelio sumą.
    • Duomenų rėmelio stulpelių pridėjimas
    • Pridėkite stulpelius į Pandas duomenų rėmelį, atitinkantį nurodytą sąlygą.
    • Sugrupavę duomenų rėmelio duomenis, nustatykite sumą.

Kaip nustatyti duomenų rėmelių stulpelių sumą?

„Pandas“ funkcija „dataframe.sum()“ grąžina visą nurodytos ašies sumą. Jei įvestis yra indekso ašis, funkcija prideda kiekvieno stulpelio reikšmes atskirai, tada daro tą patį kiekvienam stulpeliui, grąžindama seriją, kurioje saugoma kiekvieno stulpelio duomenų / reikšmių suma. Be to, ji palaiko duomenų rėmelio sumos apskaičiavimą, ignoruojant trūkstamas reikšmes.



Sintaksė: DataFrame.sum(axis = nėra, skipna = nėra, lygis = nėra, tik skaitinis = nėra, min_count = 0, **kwargs)



kur,





ašis: {stulpeliai (1), indeksas (0)}

įsakymas: Skaičiuodami rezultatą, nepaisykite NA/null reikšmių.



lygis: Jei nurodyta ašis yra hierarchinė (kelių indeksų), prieš konvertuodami į seriją suskaičiuokite iki konkretaus indekso lygio.

numeric_only: Priimtini tik float, int ir loginiai stulpeliai. Jei Nėra, pabandykite naudoti viską; jei ne, tai tik skaitiniai duomenys. Serijai, neįdiegta.

min_count: Galimų verčių, reikalingų operacijai užbaigti, skaičius. Rezultatas bus NA, jei bus mažiau ne NA verčių nei min_count.

Grąžina: DataFrame (jei nurodytas lygis) arba Series.

01 pavyzdys: nustatykite duomenų rėmelio stulpelio ir visų stulpelių sumą

Pirmiausia mums reikia duomenų rėmelio su galiojančiais duomenų tipais, ty int, float ir kt., stulpeliu ar stulpeliais, kurių duomenų sumą galime rasti. Duomenų rėmelis bus sukurtas naudojant pd.DataFrame() funkciją.


Sukūrėme reikiamą duomenų rėmelį iš python žodyno funkcijos pd.DataFrame() viduje. Aukščiau sukurtame duomenų rėmelyje yra keturi stulpeliai „Vardas“, „day1“, „day2“ ir „day3“. Iš keturių stulpelių trys stulpeliai, ty „day1“, „day2“ ir „day3“ yra skaitiniai stulpeliai su duomenų reikšmėmis (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, 5, 2, 3, 4, 6, 2) ir (7, 4, 3, 5, 6, 2, 1, 4) atitinkamai. Galime rasti tik šių trijų stulpelių sumą. Abiejų serijų (ty stulpelio) ir viso duomenų kadro sumą galima nustatyti naudojant sum() metodą. Pradėkime mokydami, kaip susumuoti visus Pandos stulpelio duomenis.


Norėdami nustatyti sumą, stulpelyje „day2“ naudojome metodą sum (). Funkcija grąžino sumos reikšmę 28. Panašiai, galime nustatyti kiekvieno duomenų rėmelio stulpelio sumą. Tai pasieksite tiesiog naudojant sum() metodą visame duomenų rėmelyje.


Kaip matyti, stulpelio „day1“ suma yra 31; „day2“ sumos reikšmė yra 28, o stulpelio „day3“ suma yra 32.

02 pavyzdys: Sum() funkcijos naudojimas duomenų rėmelio stulpelių reikšmėms kartu susumuoti

Kaip matote iš ankstesnio pavyzdžio išvesties, funkcija nepateikė faktinių duomenų rėmelio stulpelio duomenų, sudarančių sumą. Tačiau „DataFrame“ stulpeliui priskyrę metodą „DataFrame.sum()“, galite pasiekti kiekvieną DataFrame stulpelį, įskaitant sumos stulpelį. Pirmiausia sukuriame kitą šio pavyzdžio duomenų rėmelį.


Naudojant pd.DataFrame() mūsų duomenų rėmelis buvo sukurtas. Sukūrėme duomenų rėmelį su trimis stulpeliais: prekė, kaina ir mokesčiai. Stulpelio elementas, kuriame yra eilutės reikšmės („rašiklis“, „žymeklis“, „liniuote“, „trintukas“, „pieštukas“, „iškarpinė“, „segiklis“, „smeigtukai“), stulpelio kaina, kurioje saugomos reikšmės (20, 15, 10, 3, 5, 30, 35, 10), o stulpelis „mokesčiai“ susideda iš reikšmių (8, 5, 3, 3, 4, 10, 5, 2). Dabar sudėkime kainos ir mokesčių stulpelių reikšmes ir išsaugokime rezultatus naujame stulpelyje, palikdami pradinius duomenų rėmelio stulpelius.


Kaip galima pastebėti kartu su nauju stulpeliu „viso“, funkcija grąžina ir pirminius duoto duomenų rėmelio stulpelius. Stulpelyje „iš viso“ saugoma stulpelių „kaina“ ir „mokestis“ verčių suma pagal kiekvieną „prekės“ duomenis.

03 pavyzdys: funkcijos sum() naudojimas norint nustatyti nurodytų duomenų rėmelių stulpelių sumą

Norėdami kartu susumuoti kelis duomenų rėmelio stulpelius, galime nurodyti sąrašą su stulpelių etiketėmis ir tada sąraše taikyti sum() metodą, kad surastume sumą. Kaip ir ankstesniuose pavyzdžiuose, pirmiausia sukursime duomenų rėmelį.


Sukūrėme duomenų rėmelį su keturiais stulpeliais „studentai“, „marks1“, „marks2“ ir „marks3“. Stulpelyje „studentai“ saugomi duomenys („Larry“, „James“, „Rob“, „Arya“, „Max“, „Ben“, „Gwen“, „Bill“), o stulpelyje „marks1“ saugomi reikšmės (8, 9, 6, 8, 10, 7, 9, 9), o stulpeliuose „marks2“ ir „marks3“ saugomos skaitinės reikšmės (6, 6, 8, 6, 7, 9, 10, 9). ) ir (7, 6, 9, 7, 8, 7, 10, 10) atitinkamai.


Pirmiausia sukūrėme sąrašo objektą su stulpelių etiketėmis „studentai“, „marks1“ ir „marks3“. Tada sąrašui taikomas sum() metodas. Funkcija susumavo pažymių1 ir pažymių3 stulpelių reikšmes tik todėl, kad stulpelis „mokiniai“ yra neskaitinis, todėl funkcija sum() negali rasti stulpelio „mokiniai“ reikšmių sumos. Stulpelyje „suma“ išsaugojome stulpelių „marks1“ ir „marks3“ reikšmių sumą.

04 pavyzdys: pridėkite Pandas duomenų rėmelio stulpelius, kurie atitinka nurodytą sąlygą

Šiame pavyzdyje pridėsime nurodytų stulpelių reikšmes, jei jos atitinka nurodytą sąlygą.


Naujai sukurtame duomenų rėmelyje yra 5 stulpeliai, t. y. „company“, „week1_sales“, „week2_sales“, „week3_sales“ ir „filialai“. Tarkime, kad mes nenorime pridėti paskutinio stulpelio vertės, kai pridedame arba randame nurodytų duomenų rėmelio eilučių reikšmių sumą. Tarkime, kad tiesiog norėjome pridėti stulpelių reikšmes su žodžiu „savaitė“ jų etiketėse. Sąrašo supratimas gali būti sukurtas siekiant nustatyti, ar žodis „savaitė“ yra stulpelio etiketėje, ar ne.


Dabar gavome stulpelius, kurių etiketėse yra žodis „savaitė“. Galime apibendrinti stulpelius, kuriuose yra žodis „savaitė“, naudodami sum() funkcijos argumentą axis=1.


Tokiu būdu galime saugiai susumuoti stulpelių duomenis pagal eilutes, neįtraukdami jokių stulpelių, kurių nenorime.

5 pavyzdys: Sugrupavę duomenų rėmelio duomenis, nustatykite sumą

Duomenų rėmelio stulpelių sumą taip pat galime rasti sugrupavę vieno ar kelių stulpelių duomenis. Metodas groupby() bus naudojamas duomenims sugrupuoti į kategorijas stulpelyje. Sukurkime duomenų rėmelį, kad galėtume sugrupuoti vieno iš jo stulpelių duomenis.


Dabar sugrupuosime duomenis stulpelyje „amžius“ ir susumuosime stulpelių „score1“ ir „score2“ reikšmes kiekvienai grupės kategorijai.


Matome, kad susumavus duomenis duomenų rėmelyje pirmą kartą sugrupavus duomenų reikšmes pagal amžių, gaunama stulpelių suma, priklausomai nuo amžiaus grupių.

Išvada

Šioje pamokoje bandėme išmokyti jus, kaip apskaičiuoti duomenų kadrų sumą naudojant Pandos sumos metodą. Šio įrašo pavyzdžiuose aptarėme reikšmių pridėjimą pagal eilutes ir stulpelius. Be to, sužinojote, kaip sąlygiškai pridėti stulpelius ir susumuoti reikšmes sugrupavus duomenų rėmelio stulpelį. Dabar galbūt galėsite susumuoti duomenų rėmelio stulpelius arba patys susumuoti reikšmes duomenų rėmelio stulpelyje.