Kaip įdiegti „Tesseract“ sistemoje „Windows“.

Kaip Idiegti Tesseract Sistemoje Windows



Tesseract yra laisvai prieinamas atvirojo kodo teksto atpažinimo įrankis, dar žinomas kaip OCR (optinis simbolių atpažinimas). Jis pirmiausia naudojamas tekstui identifikuoti ir ištraukti iš vaizdų. Jis skaitys tekstą iš vaizdo duomenų ir įrašys išvestį į naują .txt failą. „Tesseract“ taip pat veikia naudojant „Python“, nes ji daugiausia naudojama atpažinti rašyseną iš vaizdų. Jis naudoja LSTR (ilgalaikės trumpalaikės atminties) modelį. Tesseract dirba pagal Apache 2.0 licenciją.

Šiame tinklaraštyje išsamiau aptarsime „Tesseract“ diegimo „Windows“ metodą.







Taigi, pradėkime!



Kaip įdiegti „Tesseract“ sistemoje „Windows“?

Tesseract yra komandų eilutės įrankis, naudojamas tekstui išgauti iš vaizdų. Norėdami įdiegti „Tesseract“ sistemoje „Windows“, turite vadovautis toliau pateiktomis instrukcijomis.



1 veiksmas: atsisiųskite „Tesseract Installer“.





Pirmiausia eikite į toliau pateiktą nuorodą ir atsisiųskite „Tesseract“ diegimo programą pagal savo sistemos specifikaciją:

https: // github.com / UB-Manheimas / tesseraktas / savaitę



2 veiksmas: paleiskite „Tesseract Installer“.

Apsilankykite „ Atsisiuntimai “ katalogą, kuriame atsisiunčiama „Tesseract“ diegimo programa. Norėdami įdiegti Tesseract sistemoje Windows, paleiskite Tesseract diegimo programą dukart spustelėdami ją:

3 veiksmas: pasirinkite kalbą

„Tesseract“ diegimo programa palaiko daugelį kalbų. Norėdami sąveikauti su diegimo programos vartotojo sąsaja, pasirinkite „ Anglų “ kaip savo kalbą ir spustelėkite „ Gerai “:

4 veiksmas: įdiekite „Tesseact“.

Tai padarius ekrane pasirodys Tesseract OCR sąrankos vedlys. Norėdami pradėti „Tesseact“ diegimą, paspauskite „ Kitas “ mygtukas:

Norėdami priimti „ Licencijos sutartis “, spustelėkite „ Aš sutinku “ mygtukas:

pasirinkite ' Įdiegti programą visiems kompiuterio vartotojams “ parinktį ir paspauskite „ Kitas “ mygtukas:

Jei norite pridėti scenarijaus duomenų arba įtraukti kitą kalbą, pažymėkite atitinkamus jų žymimuosius laukelius ir paspauskite „ Kitas “ mygtuką. Kadangi nenorime jokio papildomo duomenų scenarijaus ar kalbos, tęsime numatytąsias pasirinktas parinktis:

Pasirinkite diegimo vietą ir spustelėkite „ Kitas “ mygtukas:

Jei nenorite sukurti nuorodos meniu Pradėti, pažymėkite „ Nekurkite nuorodų “ žymimąjį laukelį ir paspauskite „ Diegti “ mygtukas:

Po to bus pradėtas Tesseract diegimas. Palaukite, kol diegimas bus baigtas ir paspauskite „ Kitas “ mygtukas:

Galiausiai spustelėkite „ Baigti “ mygtukas:

5 veiksmas: nustatykite aplinkos kintamąjį

Įdiegę turite nustatyti Tesseract aplinkos kintamąjį. Norėdami tai padaryti, pirmiausia apsilankykite kataloge, kuriame įdiegėte „Tesseract“, ir nukopijuokite kelią iš „ Adresas “ juosta:

Atlikite paiešką pagal „ aplinkos įvairovė ' viduje ' Pradėti meniu ir atidarykite Redaguokite sistemos aplinkos kintamuosius “:

Nustatymuose eikite į „ Išplėstinė “ nustatymų meniu ir spustelėkite „ aplinkos įvairovė “ mygtukas:

Pasirink ' Kelias 'Kintamasis iš ' Sistemos kintamieji “ skydelį ir paspauskite „ Redaguoti “ mygtukas:

Po to ' Redaguoti aplinkos kintamąjį “ langas pasirodys ekrane. Paspauskite ' Nauja “ mygtuką ir čia įklijuokite nukopijuotą „Tesseract“ diegimo katalogo kelią. Galiausiai spustelėkite „ Gerai “ mygtukas:

6 veiksmas: patikrinkite „Tesseract“ diegimą

Norėdami patikrinti „Tesseract“ diegimą, atidarykite „Windows“ komandų eilutę ieškodami „ Komandinė eilutė ' viduje ' Pradėti ' Meniu:

Patikrinkite Tesseract versiją naudodami pateiktą komandą:

> tesseraktas -- versija

Žemiau pateikta išvestis rodo, kad sėkmingai įdiegėme Tesseract versiją ' v5.2.0 “ sistemoje „Windows“:

Pereikime į priekį ir patikrinkime, kaip naudoti „Tesseract“ sistemoje „Windows“.

Kaip naudoti „Tesseract“ sistemoje „Windows“?

Tesseract naudojamas skaityti rašyseną arba ištraukti tekstą iš paveikslėlių. Pažiūrėkime, kaip tai veikia:

1 veiksmas: pasirinkite paveikslėlį

Pasirinkite vaizdą, iš kurio norite išgauti tekstą. Kaip mes pasirinkome ' 1.png “:

2 veiksmas: ištraukite tekstą iš vaizdo

Atidarius CMD. Pasinaudokite ' cd “ komanda, kad pakeistumėte katalogą, kuriame saugomas vaizdas. Tada paleiskite „ tesseraktas “ komandą ir apibrėžkite vaizdo failo pavadinimą, kaip nurodėme „ 1.png “. „ Tekstas “ parametras rodo išvesties failo pavadinimą:

> cd C:\Users\anuma\OneDrive\Pictures\Saved Pictures
> tesseraktas 1 .png 'Tekstas'

3 veiksmas: patikrinkite teksto ištraukimą

Norėdami patikrinti teksto ištraukimą, eikite į katalogą, kuriame yra vaizdo failas. Matote, kad išvesties failas „ Tekstas “ čia taip pat išsaugotas. Dukart spustelėkite išvesties failą, kad patikrintumėte, ar tesseraktas ištraukė tekstą iš vaizdo, ar ne:

Matote, kad sėkmingai ištraukėme tekstą naudodami Tesseract komandinės eilutės įrankį:

Mes pademonstravome techniką, kaip įdiegti ir naudoti Tesseract sistemoje Windows.

Išvada

Norint įdiegti „Tesseract“ sistemoje „Windows“, reikia atsisiųsti „Tesseract“ diegimo programą. Tuo tikslu sekite pirmąją šio straipsnio sesiją. Tada nustatykite aplinkos kintamąjį „Path“, kad jis būtų naudojamas, ir pasiekite „Tesseract“ iš „Windows“ komandų eilutės. Tada pasirinkite vaizdo failą ir naudokite „ Tesseraktas “ komanda atpažinti ir ištraukti tekstą iš vaizdo. Čia jūs išmokote įdiegti ir naudoti „ Tesseraktas “ ant langų.