XLSX į CSV Python

Xlsx I Csv Python



Pastaraisiais metais Python tapo viena iš dominuojančių programavimo kalbų. Python bendruomenė labai išsiplėtė dėl Python populiarumo ir naudingumo. Šiame straipsnyje aptarsime, kaip naudoti Python konvertuoti XLSX į CSV. Žinome, kad Excel failai dažnai naudojami finansinei analizei atlikti, duomenims tvarkyti, duomenų įvedimui, apskaitai, duomenų valdymui, diagramų ir grafikų kūrimui ir pan. Tačiau dažniausiai duomenims importuoti ir eksportuoti norime naudoti CSV failus. Vienas iš būdų yra perkelti struktūrinius duomenis naudojant paprasto teksto failą.

Kas yra Xslx failas?

Kurdama skaičiuokles naujausiose „Excel“ versijose, „Microsoft“ kaip numatytąjį failo tipą naudoja XLSX failą. Panašiai kaip Word DOCX failo tipas, XLSX failus galime atidaryti naudodami įvairias programas / programas.

Kas yra CSV failas?

CSV failo formatas yra tai, ką galime naudoti lentelių duomenų reikšmėms saugoti skaičiuoklėse ir duomenų bazėse. Lentelės duomenys, tekstas arba tekstas, saugomi kaip paprastas tekstas CSV faile. CSV failo įrašas yra duomenų reikšmė, saugoma kiekvienoje failo eilutėje. Kiekvienas įrašas gali turėti daugiau nei vieną lauką, atskirtą kableliais.







Pagrindiniai XLSX ir CSV failų skirtumai

Vartotojai dažnai naudoja CSV ir XLSX pakaitomis ir paprastai nežino, kuo jie skiriasi, kokios yra pagrindinės jų savybės ir kaip jie veikia. Jis tarnauja tik kaip informacijos šaltinis vartotojui. Beveik kiekviena įmonė ir įmonė naudoja abu, kad padėtų vartotojams tvarkyti, atnaujinti ir saugoti vartotojo duomenis. Toliau pateikiami keli pagrindiniai XLSX ir CSV failų skirtumai, kuriuos turėtumėte žinoti:



  • CSV formatas išsaugo lentelės duomenis į skyriklio teksto failą su .csv plėtiniu. Tuo tarpu „Excel“ arba XLSX failas yra skaičiuoklė, kurioje saugomi failai patentuotu formatu, t. xls arba XLSX.
  • „Excel“ failai yra dvejetainiai failai, kuriuose yra duomenys kiekviename darbaknygės darbalapyje. Tuo tarpu CSV yra paprastas ir paprastas teksto formatas su duomenų reikšmių seka, atskirta kableliais.
  • Duomenų operacijų negalima atlikti su CSV failais. Tačiau juos galima atlikti naudojant „Excel“ failus.
  • CSV failai yra greitesni ir naudoja mažiau atminties nei XLSX failai. Tačiau „Excel“ naudoja daugiau atminties importuodama duomenis.
  • Jei palyginsime CSV su „Excel“, CSV failus galime atidaryti bet kuriame „Windows“ teksto rengyklėje, o „Excel“ failai negali.

Kaip XLSX failą galima konvertuoti į CSV naudojant Python?

XLSX failą galima paversti CSV failu Python naudojant įvairius metodus. Python apima daugybę modulių ir funkcijų, kurios gali padėti mums atlikti šią užduotį. Čia mes išnagrinėsime keletą metodų, kuriuos galima naudoti konvertuojant XLSX failus į CSV failus Python.



Būtinos sąlygos konvertuoti „Excel“ į CSV

Reikalavimų įdiegimas yra pirmas žingsnis. Šioje pamokoje naudojame tokius modulius kaip Pandas, CSV ir Openpyxl ir kt. Python Pandas paketas leidžia manipuliuoti ir analizuoti duomenis. „Pandos“ yra gerai žinoma „Python“ programuotojų biblioteka. „Excel“ failus galima skaityti ir rašyti naudojant „Python“ paketą, žinomą kaip „Openpyxl“. Su šia biblioteka tiesiogiai nesusidursime. Vietoj to, pandos viduje naudoja Openpyxl.





Naudodami PyPI saugyklą galime įdiegti abu paketus:

1 būdas: XLSX konvertavimas į CSV naudojant Pandas modulį

1 pavyzdys: vieno XLSX failo konvertavimas į CSV



Pandas yra atvirojo kodo modulis, sukurtas Python programavimo kalbai manipuliuoti ir analizuoti duomenis. Norėdami dirbti su laiko eilutėmis ir skaitinėmis lentelėmis, „Pandas“ siūlo daugybę funkcijų ir funkcijų. Naudojant pandas, galima nuskaityti, filtruoti ir pertvarkyti tiek mažus, tiek didžiulius duomenų rinkinius. Ir rezultatai gali būti pateikiami įvairiais formatais, tokiais kaip „Excel“, JSON ir CSV. „Excel“ failui skaityti naudojame Pandas metodą read_excel() ir „DataFrame“ paversti CSV failu metodu to_csv().

Spausdiname .csv failą kaip DataFrame, kaip matyti išvestyje. Ankstesnis scenarijus konvertuoja mūsų XLSX failą į CSV ir sukuria „salary.csv“ failą dabartiniame kataloge.

2 pavyzdys: XLSX failo (su keliais lapais) konvertavimas į CSV

Toliau pateiktame pavyzdyje pirmiausia perskaitome „Excel“ failo lapų pavadinimus. Tada atskirų lapų pavadinimai perkeliami ir išsaugomi kaip atskiri CSV failai. Scenarijus išsaugo CSV toje pačioje vietoje.

Naudojame pavyzdinį XLSX failą, kuriame yra du ar daugiau darbalapių arba skaičiuoklių.

Kaip matote, mūsų XLSX failą sudaro du lapai (1 lapas ir 2 lapas). Dabar rašome kodą, skirtą konvertuoti šį XLSX failą į CSV.

Išvestis:

Scenarijus sėkmingai konvertavo XLSX failą su dviem lapais į vieną CSV failą su vienu lapu.

3 pavyzdys: Kelių XLSX failų konvertavimas į atskirus CSV failus

Apsvarstykite scenarijų, kai reikia konvertuoti kelis „Excel“ failus savo darbo kataloge į CSV. Galite naudoti šį metodą. Pradedame darydami prielaidą, kad kiekviename faile yra tik vienas lapas. Tada išplečiame savo metodą, kad galėtume tvarkyti kelis failus ir kelis lapus. Toliau pateiktame Python kode naudojamas glob standartinis modulis. Failų kelius suderiname naudodami šablonus su Glob. Jis atitinka visus failus su plėtiniu .xlsx darbiniame kataloge. Po to sukuriame funkciją, kuri nuskaito „Excel“ failus ir išsaugo juos kaip CSV failus. Šią funkciją vadiname kiekviename rastame failo kelyje.

Šis ankstesnis scenarijus konvertuoja visus xlsx failus dabartiniame kataloge į CSV failus.

Dabar XLSX failus su keliomis skaičiuoklėmis konvertuojame į CSV. Greičiausiai tai yra sunkiausia dalis. Trys Excel failai yra mūsų darbo kataloge. Be to, kai kurie iš jų susideda iš daugiau nei vieno lapo. Mes siekiame:

  1. Sukurkite katalogą kiekvienam skaičiuoklės failui,
  2. Konvertuokite „Excel“ failų lapus į CSV ir jie turėtų būti saugomi naujai sukurtame kataloge.

Scenarijus konvertuoja XLSX su vienu ir keliais lapais į atskirus CSV failus ir išsaugo juos naujuose kataloguose tuo pačiu pavadinimu.

Norint gauti kiekvieną Excel failą, esantį dabartiniame kataloge, naudojama glob funkcija. Po to kiekvienam XLSX failui sukuriami aplankai naudojant funkciją os.mkdir. Tada kiekvienam lapui naujajame kataloge sukuriamas CSV failas, perbraukiant lapo pavadinimą.

2 būdas: XLSX konvertavimas į CSV naudojant Openpyxl ir CSV modulius

Šiuo metodu naudosime openpyxl ir CSV modulius, norėdami konvertuoti XLSX failus į CSV. Norint skaityti ir rašyti 2010 xlsx, xlsm, xltx ir xltm failus, galima naudoti Python modulį openpyxl. CSV modulis apima klases, kurios leidžia skaityti ir rašyti CSV formato lentelių duomenis.

Norėdami perskaityti arba įkelti xlsx failą, naudojame openpyxl modulio funkciją load_workbook(). Šią funkciją galite naudoti, jei reikia rašyti arba skaityti esamą XLSX/Excel failą programoje Python. Suaktyvinę Excel, mes naudojame funkciją csv.writer() norėdami sukurti CSV failą. Tada for-ciklas naudojamas duomenims saugoti CSV failo duomenų langeliuose. Konvertuojame failą example.xlsx į myfile.csv, kaip parodyta šiame paveikslėlyje:

Išvada

Šioje pamokoje trumpai supažindinome su XLSX ir CSV failais. Mes paaiškinome pagrindinius abiejų failų formatų skirtumus. Aptarėme du metodus su keliais pavyzdžiais, kad išmokytume, kaip XLSX failus su vienu ar keliais lapais galima konvertuoti į CSV failus. Įdiegėme pavyzdį, kaip vienu metu konvertuoti kelis XLSX failus į CSV failus. Gali būti paprasta arba sudėtinga konvertuoti duomenis iš „Excel“ į CSV. Jei turite tik vieną failą su nedideliu lapų skaičiumi, tai paprasta. Bet jei ne, gali būti sunku.