Pandos Skaityti tekstinį failą

Pandos Skaityti Tekstini Faila



„Pandose“ galime lengvai perskaityti tekstinį failą naudodami „pandų“ metodą. „Pandas“ suteikia mums galimybę skaityti tekstinį failą. „Pandas“ pateikia skirtingus įtaisytuosius tekstinio failo skaitymo būdus. Aptarsime visus metodus šioje pamokoje kartu su visais čia esančiais parametrais ir juos išsamiai paaiškinsime. Be to, mes skaitysime tekstinį failą „pandos“ naudodami „pandos“ metodus mūsų koduose.

Teksto failo skaitymo „pandos“ metodai

„Pandose“ turime tris metodus, kurie padeda mums skaityti tekstinį failą. Čia taip pat pateikėme keletą pavyzdžių, kuriuose skaitome tekstinį failą. „Pandų“ siūlomi metodai aptariami toliau:







    • Naudojant pd.read_csv() metodą.
    • Naudojant pd.read_table() metodą.
    • Naudojant pd.read_fwf() metodą.

Dabar šioje pamokoje paaiškiname visų šių metodų sintaksę ir taip pat išsamiai aptariame visų metodų parametrus.



read_csv() sintaksė



pd.read_csv ( „failo pavadinimas.txt“, rugsėjis ='', antraštę = Nėra, vardai = [ „Stulpelio_pavadinimas1“, „Stulpelio_pavadinimas2“, „Stulpelio_pavadinimas2“, ………….. ] )


Šiuo metodu pirmiausia pridedame tekstinio failo, kurio duomenis norime perskaityti, pavadinimą ir tai yra pirmasis šio metodo parametras. Tada įdedame „sep“, kuris yra šio metodo skyriklis, ir tarpą įdedame kaip simbolį, kad tarpas būtų laikomas skyrikliu. Po to turime antraštės parametrą ir naudojama šio parametro reikšmė „Nėra“, todėl bus sukurta numatytoji antraštė, o jei šio parametro nepridėsime, bus atsižvelgta į pirmąją tekstinio failo eilutę. kaip antraštė. Parametre „pavadinimai“ galime pridėti stulpelių pavadinimus, kuriuos turime pridėti kaip antraštę.





Read_table() sintaksė

pd.read_table ( 'failo pavadinimas.txt' , skyriklis = '' )


Taikant šį metodą, kaip pirmąjį parametrą įtraukiame tekstinio failo pavadinimą. Kai skyriklyje įdedame „ “, tarpo simbolis naudojamas kaip skyriklis.



read_fwf() sintaksė

pd.read_fwf ( 'failo pavadinimas.txt' )


Šis metodas reikalauja tik vieno parametro, kuris yra tekstinio failo pavadinimas.

Dabar mes naudosime šiuos metodus tekstiniams failams skaityti „pandos“ koduose ir tekstinio failo duomenims rodyti terminale.

Pavyzdys # 01

„Spyder“ programa yra čia, kurioje atlikome visus šiuos šiame vadove pateiktus kodus. Tekstinis failas, kurio duomenis norime perskaityti, parodytas žemiau. Mes naudosime „read_csv()“ metodą, norėdami skaityti šį tekstinį failą „pandos“.


Pirmiausia importuojame „pandų“ biblioteką, nes norime panaudoti „read_csv()“ metodą, o tai yra „pandos“ metodas. Šį metodą pasiekiame tik tada, kai importuojame „pandų“ biblioteką. Čia mes minime „pandas kaip pd“, todėl šis „pd“ pateikiamas kartu su jo naudojimo metodo pavadinimu. Po to čia sukuriame kintamąjį „df“, kuris naudojamas tekstinio failo duomenims saugoti po skaitymo. Čia pateikiame metodą „pd.read_csv()“, kuris padeda nuskaityti tekstinį failą ir konvertuoti tekstinio failo duomenis į „DataFrame“ ir saugoti juos „df“ kintamajame.

Čia perdavėme failo pavadinimą, kuris yra „myData.txt“, tada naudojame „sep“ ir šiam „sep“ priskiriame tuščią simbolį. Taigi, šis tuščias simbolis veikia kaip skyriklis tekstiniame faile. Tada mes panaudojome žemiau esantį „print ()“, kuris naudojamas tekstinio failo duomenims spausdinti. Jis parodys tekstinio failo duomenis DataFrame formoje.


Norėdami vykdyti šį kodą, turime paspausti „Shift+Enter“, o išvestis bus pateikta „Spyder“ terminale. Aukščiau pateikto kodo rezultatas rodomas duotoje ekrano kopijoje ir matote, kad tekstinio failo duomenys rodomi kaip DataFrame, o pirmoji tekstinio failo eilutė čia pateikiama kaip to DataFrame stulpelių pavadinimai. Jis taip pat atskiria duomenis, kuriuose tekstiniame faile yra tarpo simbolis.

02 pavyzdys

Tekstinis failas, kurį skaitysime šiame pavyzdyje, parodytas čia, ir mes vėl naudosime „read_csv()“ metodą, bet su skirtingais parametrais.


Naudojamas 'pandos' metodas 'pd.read_csv()', ir čia perduodame tris parametrus. Pirmiausia įdedame failo pavadinimą, kuris yra 'Record.txt'. Antrasis parametras yra parametras „sep“ ir jam priskiria tuščią simbolį, o tada turime trečiąjį parametrą, kuriame nustatome „antraštę“ ir pakoreguojame ją į „Nėra“, taigi jis sukurs numatytąją DataFrame antraštę. kai vykdome šį kodą. Mes visa tai išsaugojome „My_Record“ kintamajame ir taip pat įtraukėme „My_Record“ į funkciją „print()“, kad būtų galima spausdinti.


Visi duomenys išsaugomi DataFrame ir atskiria duomenis, kur teksto failo duomenyse yra tarpo simbolis. Be to, čia buvo sukurta numatytoji „DataFrame“ antraštė, nes „antraštės“ parametrą pakoregavome į „Nėra“.

03 pavyzdys

Rodomas šio pavyzdžio tekstinis failas ir mes dar kartą naudosime „read_csv()“ metodą su pakeistais parametrais.


Šiame kode keturi parametrai čia perduodami „pandos“ metodui „pd.read_csv()“. Tekstinio failo pavadinimas yra pirmasis parametras. Parametras „sep“ antrame parametre yra tuščias. Parametras „header“ nustatytas į „Nėra“ trečiajame argumente, o kaip ketvirtasis parametras nustatėme „pavadinimus“, kurie bus rodomi kaip DataFrame stulpelių pavadinimai perskaičius tekstinį failą, ir šie stulpelių pavadinimai yra „COL_1, COL_2, COL_3, COL_4 ir COL_5“. Visa ši informacija buvo išsaugota „My_Record“ kintamajame, o „My_Record“ taip pat buvo pridėta prie „print()“ metodo, todėl ji bus spausdinama terminale.


Visa tekstinio failo informacija čia pateikiama kaip DataFrame, taip pat ji atskiria duomenis, kur tekstiniame faile pridedami tarpai. Ji taip pat atitinkamai prideda stulpelių pavadinimus, kuriuos mes įtraukėme aukščiau į kodą.

04 pavyzdys

Tai tekstinis failas, kurį skaitysime šiame pavyzdyje naudodami kitą metodą – metodą „pd.read_table()“.


Teksto failo skaitymui čia pridedamas metodas „pd.read_table()“, o mes pridedame „ABC.txt“, kuris yra tekstinio failo pavadinimas. Šis metodas padeda skaityti tekstinį failą, be to, mes pakoregavome parametrą „ribotuvas“ prie tarpo simbolio, todėl jis taip pat veiks kaip skyriklis, kurį paaiškinome aukščiau. Tada visi teksto failo duomenys išsaugomi „My_Data“ kintamajame ir taip pat atspausdinami čia.


Pradinė tekstinio failo eilutė čia rodoma kaip DataFrame stulpelių pavadinimai, o tekstinio failo duomenys spausdinami kaip DataFrame. Be to, jis atskiria tekstinio failo duomenis, kuriuose yra tarpo simbolis.

05 pavyzdys

Dabar tekstiniame faile yra duomenys, kurie rodomi žemiau. Šį kartą pritaikysime „read_fwf()“ ir parodysime, kaip jis pateikia duomenis perskaitęs tekstinį failą.


Kaip žinome, šis 'read_fwf()' metodas reikalauja tik vieno parametro, kuris yra failo pavadinimas, kurį norime perskaityti. Čia pridedame „textfile.txt“, kuris yra mūsų tekstinio failo pavadinimas, ir šį pandos metodą priskiriame kintamajam „File_Data“, kuriame bus saugomi šio tekstinio failo duomenys. Tada įdedame 'print (File_Data)', todėl jis taip pat spausdina šiuos duomenis.


Čia rodomi visi tekstinio failo duomenys. Ji neatskyrė duomenų, kuriuose yra tarpo simbolių, nes šioje funkcijoje nėra parametro, pvz., „Rugsėjo“ ar „Rugsėjo“.

Išvada

Šioje pamokoje paaiškinama, kaip skaityti tekstinį failą „pandose“ ir kokie metodai naudojami tekstiniam failui skaityti „pandose“. Aptarėme visus metodus, kurie padeda mums skaityti tekstinį failą „pandos“. Šioje pamokoje ištyrėme tris skirtingus „pandų“ metodus, kaip skaityti tekstinius failus „pandose“. Taip pat čia išsamiai paaiškinome visų metodų sintaksę ir visų metodų parametrus bei perskaitėme daug tekstinių failų, taikydami skirtingus metodus su visais galimais parametrais šioje pamokoje.