Pandos prisijungia prieš susijungimą

Pandos Prisijungia Pries Susijungima



„Pandas“ yra didelio našumo įrankis, skirtas python aplinkai. Tai yra „atviras“ šaltinio kodas duomenų analizei. Pandų sujungimo ir pandų sujungimo metodas naudojami dviem duomenų rėmeliams sujungti į vieną duomenų kadrą. Abiejuose pandų metoduose skirtumas yra tas, kad pandos „prisijungti“ funkcija sujungia duomenų rėmelį naudodama indeksą. Nors pandų „sujungimo“ funkcija prisijungia prie duomenų rėmelio naudodami indeksą ir stulpelio metodą, kuriame patys galime pasirinkti norimą stulpelį. Pandų sujungimo metodas naudojamas dažniausiai, palyginti su pandų sujungimo metodu. Programinė įranga, kurią naudosime diegdami, yra „spyder“ programinė įranga, esanti python aplinkoje, kuri suteiks mums pranašumų diegiant pandas join method() kodą ir pandas merge() metodo funkciją.

Metodo Pandas Join() sintaksė

„df1. prisijungti ( df2 )

Aukščiau pateiktoje sintaksėje esantis „df“ yra „dataframe“ santrumpa. Sintaksėje yra du duomenų rėmeliai su funkcija „dot join“, kuri skirta metodo iškvietimui. Tai pandų metodas dviejų duomenų rėmelių sujungimui. Jis veikia naudojant indeksą, kad sujungtų duomenų kadrus į vieną.







Metodo Pandas Merge() sintaksė

„df1. sujungti ( df2 , įjungta = 'stulpelio_pavadinimas' )

Pandų sujungimo metodo sintaksėje yra du duomenų rėmeliai: „df1“ ir „df2“. „Taškų sujungimo“ funkcija iškviečia abiejų duomenų rėmelių sujungimo metodą, kai stulpeliai yra apversti.



Mes apžvelgsime šiuos dviejų duomenų rėmelių sujungimo būdus, kad būtų galima naudoti pandų sujungimo ir pandų prisijungimo metodus:



  • Pandas Join metodas sutampa.
  • Pandos prisijungia prie metodo naudodamos indekso atstatymą.
  • Pandų sujungimo metodas (stulpelis „kairė ir dešinė“).
  • Pandų sujungimo metodas aiškus.

Duomenų rėmelių kūrimas Pandas Merge ir Pandas Join metodo įgyvendinimui

Pirmiausia turime sukurti duomenų rėmelį. Tam naudosime „spyder“ įrankį. Jį atidarę pradėkite rašyti kodą. Importuokite pandas kaip „pd“ pandų bibliotekos asociacijai. Duomenų rėmelio kintamieji yra atitinkamai „x“, „y“, „p“ ir „q“, o „a“ su reikšmėmis „1“ ir „b“, o reikšmė priskirta kaip „2“.





Išvestis yra „df“, sukurta su priskirtomis reikšmėmis. Galime padaryti jį tokį, koks yra duomenų.



Kito duomenų rėmelio kūrimas

Turime sukurti kitą duomenų rėmelį, kad aiškiai suprastume pandų prisijungimo ir sujungimo būdus. Čia „df“ sukūrėme tą patį, kaip ir aukščiau esantis „df“, skiriasi tik priskirtų kintamųjų reikšmės. Turime „h“, „j“, „s“ ir „d“, o reikšmes „b“ priskirkite reikšmei „8“, o „Y“ – „3“.

Išvestis rodo paprastą sukurtą „df“.

01 pavyzdys: Pandų prisijungimo metodas (persidengimas)

Dabar pamatysime, kaip sujungti du duomenų rėmelius naudojant pandų prisijungimo metodą. Taikant šį metodą, iš duomenų rėmo galime pasirinkti pasirinktą stulpelį, su kuriuo norime dirbti. Mes paėmėme pavyzdį su persidengiančiu stulpeliu „kairėje“ iš „df“, todėl galime tai pataisyti naudodami „priesagą“, kad išvengtume duomenų persidengimo. Čia naudojami kintamieji „x“, „z“, „v“, „d“. „p“, „o“, „l“ ir „y“ su reikšmėmis priskirtomis „3“, „6“, „7“ ir „9“. „.join“ iškviečia metodą, kai lygiavimas nustatytas į kairę sujungti su dešine „df“ priesaga. “. Kode naudojama „priesaga“, nes duomenų rėmelyje yra du stulpeliai, kurių pavadinimas yra „raktas“ ir kurie nepersidengs su duomenimis.

Išvestyje nerodomi sutampančių duomenų, naudojant dviejų „df“ sujungimo metodą, naudojant pandų sujungimo metodą.

02 pavyzdys: Pandų prisijungimo metodas naudojant indekso nustatymą iš naujo

Šiame pavyzdyje atskirai nurodysime stulpelį su parametru „įjungta“, kad jis būtų naudojamas kaip „raktas“ metodo sujungime, kuris padeda sujungti du duomenų rėmelius. kombinuotas dalykas atliekamas su šiuo parametru. Be to, vieno iš dviejų „df“ indeksas turėtų būti panašus, kad juos sujungtų. Panašių rūšių duomenys arba tuo pačiu tikslu naudojami duomenys gali būti tvarkomi kartu. Bus naudojamas indeksas vis tiek, naudojant iš dešinės. Kintamieji yra „s“, „t“, „u“, „v“, „n“, „w“, „k“ ir „q“. Priskirtos reikšmės yra „3“, „6“, „7“ ir „9“. „Reset taško indeksas“ yra pandų būdas iš naujo nustatyti „df“ indeksą. Atkūrimo indeksas nustato visus jūsų duomenų rėmelių sąrašo sveikuosius skaičius nuo 0, kol duomenų rėmelio duomenys ten pailginami.

Čia yra išvestis, rodoma naudojant indekso „rakto“ prisijungimo metodą pandoms.

03 pavyzdys: Pandų sujungimo metodas (stulpelis „kairė ir dešinė“)

Sujungimo metodas atlieka panašią operaciją kaip ir pandų prisijungimo metodas. Abu metodai skirti duomenims sujungti panašiame duomenų rėmelyje. Sujungimo metodas yra universalesnis, todėl reikia nurodyti raktą. Taip pat galime nurodyti jį kairiajame ir dešiniajame stulpeliuose, priklausomai nuo jūsų duomenų rėmelio darbo. Kode yra kintamieji „s“, „d“, „g“, „f“, „k“, „j“, „b“ ir „q“. priskirtos reikšmės yra „9“, „5“, „6“ ir „7“. Išorinis „prisijungti“ įgyvendinimas atliekamas abiejuose „df“, naudojant pandų sujungimo metodo funkcijos parametrą „kaip“.

Išvestis, kurią matome, rodo sujungtus dviejų duomenų rėmelių duomenis. „NaN“ reiškia „ne skaičių“, o tai reiškia, kad jei duomenyse nėra priskirto numerio, „NaN“ rodomas.

04 pavyzdys: Sujungimo metodas aiškiai

Šiame pavyzdyje sujungimo metodas yra indekso sunaikinimas, o indekso reikšmė duomenų rėmelyje nepriimama. Mes atliksime šį metodą atsižvelgdami į būtiną darbą, kai aiškiai nurodyta, kad reikia imtis tolesnių veiksmų. Jis sujungs duomenis, pagrįstus kairiuoju arba dešiniuoju indeksu, su parametru. Šiame duomenų rėmelyje esantys kintamieji yra „t“, „r“, „I“, „u“, „h“, „o“, „e“ ir „e“. Priskirtos reikšmės yra „2“, „4“, „6“ ir „4“. Aukščiau pateiktas pandų sujungimo metodo pavyzdys su stulpelių pasirinkimu pagal poreikį yra vaizdingiausias ir vertingiausias dviejų duomenų rėmelių sujungimo būdas. Kodo eilutės pabaigoje tikrinama, ar duomenų rinkinyje sujungimo raktas yra unikalus.

Žemiau esančiame išvestyje indeksas nerodomas be indekso, tačiau funkcija atliekama remiantis dešiniuoju ir kairiuoju indeksu.

Išvada

Sujungimo () ir join () metodai yra labai patogūs ir veiksmingi. Abi šios funkcijos naudojamos sujungti du atskirus duomenų rėmelius tame pačiame duomenų rėmelyje, tačiau jų paskirtis skiriasi priklausomai nuo atvejo. Šiame straipsnyje mes sužinojome pagrindinius skirtumus tarp pandų prisijungimo ir sujungimo metodo. Atlikę pavyzdžius ir supratę pandų sujungimo metodą, pabaigsime žinodami, kad jei norime lankstesnio ir duomenų bazės stiliaus sujungimo, geriau rinktis pandų sujungimo metodą. Kita vertus, jei norime plačiai derinti duomenų rėmelį su indeksu, galime naudoti pandas join() metodo funkciją.