Kaip skaityti „Excel“ (xlsx) failą „Python“

How Read Excel File Python



The .xlsx yra „Excel“ dokumento pratęsimas, kuriame galima saugoti daug duomenų lentelės pavidalu, o daugelio tipų aritmetinius ir loginius skaičiavimus galima lengvai atlikti naudojant „Excel“ skaičiuoklę. Kartais programavimo tikslais reikia perskaityti „Excel“ dokumento duomenis naudojant „Python“ scenarijų. „Python“ yra daug modulių, skirtų skaityti „Excel“ dokumentą. Kai kurie naudingi moduliai yra xlrd , openpyxl , ir pandos . Šiame vadove buvo parodyti būdai, kaip naudoti šiuos modulius „Excel“ failui skaityti „Python“.

Būtina sąlyga:

Norint patikrinti šios pamokos pavyzdžius, reikės manekeno „Excel“ failo su plėtiniu .xlsx. Galite naudoti bet kurį esamą „Excel“ failą arba sukurti naują. Čia naujas „Excel“ failas pavadintas pardavimai.xlsx failas buvo sukurtas naudojant šiuos duomenis. Šis failas buvo naudojamas skaitymui, naudojant skirtingus python modulius kitoje šios pamokos dalyje.







pardavimai.xlsx



Pardavimo data Pardavėjas Suma
05/12/18 Sila Ahmed 60000
12/06/19 Aš Hossainas 50 000
08/09/20 Sarminas Jahanas 45000
04/07/21 Mahmudul Hasanas 30000

1 pavyzdys: perskaitykite „Excel“ failą naudodami „xlrd“

„Xlrd“ modulis nėra įdiegtas kartu su „Python“. Taigi, prieš naudodami modulį, turite jį įdiegti. Naujausia šio modulio versija nepalaiko „Excel“ failo su plėtiniu .xlsx. Taigi, norėdami perskaityti xlsx failą, turite įdiegti šio modulio 1.2.0 versiją. Iš terminalo paleiskite šią komandą, kad įdiegtumėte reikiamą versiją xlrd .



$pipdiegti xlrd== 1.2.0

Baigę diegimo procesą, sukurkite „python“ failą su šiuo scenarijumi, kad perskaitytumėte pardavimai.xlsx failą naudojant xlrd modulis. open_workbook () funkcija naudojama scenarijuje, atidarykite xlsx failą skaitymui. Šiame „Excel“ faile yra tik vienas lapas. Taigi workbook.sheet_by_index () funkcija buvo naudojama scenarijuje su argumento reikšme 0. Toliau įdėtas 'dėl' kilpa naudojo skaityti darbalapio langelių reikšmes, naudodami eilučių ir stulpelių reikšmes. Scenarijuje buvo naudojamos dvi diapazono () funkcijos, skirtos apibrėžti eilutės ir stulpelio dydį pagal lapo duomenis. The cell_value () funkcija buvo naudojama skaityti konkrečią lapo langelio vertę kiekvienoje ciklo iteracijoje. Kiekvienas išvesties laukas bus atskirtas vienu skirtuko tarpeliu.





# Importuokite xlrd modulį
importuoti xlrd

# Atidarykite darbaknygę
darbo knyga = xlrd.open_workbook('sales.xlsx')

# Atidarykite darbalapį
darbalapis = darbaknygė.sheet_by_index(0)

# Pakartokite eilutes ir stulpelius
dėliįdiapazonas(0,5):
dėljįdiapazonas(0,3):
# Atspausdinkite langelių reikšmes naudodami skirtuką
spausdinti(darbalapis. ląstelės_vertė(aš, j),galas=' t')
spausdinti('')

Išėjimas:

Įvykdžius aukščiau pateiktą scenarijų, pasirodys ši išvestis.



2 pavyzdys: perskaitykite „Excel“ failą naudodami „openpyxl“

The openpyxl yra dar vienas „python“ modulis, skirtas skaityti xlsx failą, ir jis taip pat nėra įdiegtas kartu su „Python“ pagal numatytuosius nustatymus. Prieš naudodami šį terminalą, paleiskite šią komandą, kad įdiegtumėte šį modulį.

$pipdiegtiopenpyxl

Baigę diegimo procesą, sukurkite „python“ failą su šiuo scenarijumi, kad perskaitytumėte pardavimai.xlsx failą. Kaip ir xlrd modulis, openpyxl modulis turi load_workbook () funkcija atidaryti xlsx failą skaitymui. The pardavimai.xlsx failas naudojamas kaip šios funkcijos argumento reikšmė. Objektas wookbook.aktyvus buvo sukurtas scenarijuje, kad būtų galima perskaityti max_row ir max_column savybės. Šios savybės buvo naudojamos įdėtose kilpose, kad būtų galima skaityti pardavimai.xlsx failą. Funkcija range () buvo naudojama skaityti lapo eilutes, o iter_cols () - lapo stulpelius. Kiekvienas išvesties laukas bus atskirtas dviem skirtukų tarpeliais.

# Importuokite „openyxl“ modulį
importuoti openpyxl

# Apibrėžkite kintamąjį, kad įkeltumėte „wookbook“
wookbook = openpyxl.load_workbook('sales.xlsx')

# Apibrėžkite kintamąjį, kad perskaitytumėte aktyvų lapą:
darbalapis = wookbook.active

# Pakartokite ciklą, kad perskaitytumėte langelio reikšmes
dėliįdiapazonas(0, darbalapis.max_row):
dėl su įdarbalapis.iter_cols(1, darbalapis.max_column):
spausdinti(su[i].vertybė,galas=' t t')
spausdinti('')

Išėjimas:

Įvykdžius aukščiau pateiktą scenarijų, pasirodys ši išvestis.

3 pavyzdys: perskaitykite „Excel“ failą naudodami pandas

Pandos modulis neįdiegtas naudojant ankstesnį modulį, panašų į python. Taigi, jei anksčiau jo neįdiegėte, turite jį įdiegti. Norėdami įdiegti, paleiskite šią komandą pandos iš terminalo.

$pipdiegtipandos

Baigę diegimo procesą, sukurkite „python“ failą su šiuo scenarijumi, kad perskaitytumėte pardavimai.xlsx failą. The read_excel () „pandas“ funkcija naudojama xlsx failui skaityti. Ši funkcija buvo naudojama scenarijuje skaityti pardavimai.xlsx failą. The „DataFrame“ () funkcija čia naudojama skaityti xlsx failo turinį duomenų rėme ir išsaugoti reikšmes kintamajame duomenis . Duomenų vertė buvo atspausdinta vėliau.

# Importuokite pandas
importuoti pandaskaippd

# Įkelkite xlsx failą
excel_data = pd.read_excel('sales.xlsx')
# Perskaitykite duomenų rėmo failo reikšmes
duomenys = pd.DataFrame(excel_data,stulpelių=[„Pardavimo data“,'Pardavėjas',„Suma“])
# Spausdinkite turinį
spausdinti(„Failo turinys yra toks: n', duomenys)

Išėjimas:

Įvykdžius aukščiau pateiktą scenarijų, pasirodys ši išvestis. Šio scenarijaus išvestis skiriasi nuo dviejų ankstesnių pavyzdžių. Eilučių numeriai spausdinami pirmame stulpelyje, kur eilutės reikšmė skaičiuojama nuo 0. Datos reikšmės lygiuojamos centre. Pardavėjų vardai sulygiuoti teisingai. Suma lygiuojama į kairę.

Išvada:

Python vartotojai turi dirbti su xlsx failais skirtingais programavimo tikslais. Šiame vadove buvo parodyti trys skirtingi xlsx failo skaitymo būdai, naudojant tris „python“ modulius. Kiekvienas modulis turi skirtingas funkcijas ir savybes, skirtas skaityti xlsx failą. Ši pamoka padės „Python“ vartotojams lengvai perskaityti xlsx failą, naudojant „python“ scenarijų, perskaitę šią pamoką.