ELF failo formato supratimas

Understanding Elf File Format



Nuo šaltinio kodo iki dvejetainio kodo

Programavimas prasideda nuo sumanios idėjos ir pirminio kodo parašymo pasirinkta programavimo kalba, pavyzdžiui, C, ir šaltinio kodo išsaugojimo faile. Naudojant tinkamą kompiliatorių, pvz., GCC, jūsų šaltinio kodas pirmiausia išverčiamas į objekto kodą. Galiausiai susiejėjas objekto kodą paverčia dvejetainiu failu, kuris susieja objekto kodą su nurodytomis bibliotekomis. Šiame faile yra vienintelės instrukcijos kaip mašinos kodas, kurias supranta procesorius, ir jos vykdomos, kai tik paleidžiama sukompiliuota programa.

Aukščiau paminėtas dvejetainis failas turi tam tikrą struktūrą, o vienas iš labiausiai paplitusių yra pavadintas ELF, kuris sutrumpina vykdomąjį ir susiejamąjį formatą. Jis plačiai naudojamas vykdomiesiems failams, perkeliamiems objektų failams, bendroms bibliotekoms ir pagrindiniams sąvartynams.







Prieš dvidešimt metų-1999 m.-projektas „86open“ pasirinko ELF kaip standartinį dvejetainio failo formatą „Unix“ ir „Unix“ tipo sistemoms „x86“ procesoriuose. Laimei, ELF formatas anksčiau buvo dokumentuotas tiek sistemos „V“ programos dvejetainėje sąsajoje, tiek „Tool Interface Standard“ [4]. Šis faktas nepaprastai supaprastino skirtingų „Unix“ operacinių sistemų pardavėjų ir kūrėjų susitarimą dėl standartizacijos.



Šio sprendimo priežastis buvo ELF dizainas-lankstumas, išplėtimas ir įvairių platformų palaikymas įvairiems endian formatams ir adresų dydžiams. ELF dizainas neapsiriboja konkrečiu procesoriumi, instrukcijų rinkiniu ar aparatūros architektūra. Išsamų vykdomųjų failų formatų palyginimą rasite čia [3].



Nuo to laiko ELF formatą naudoja kelios skirtingos operacinės sistemos. Tai, be kita ko, apima „Linux“, „Solaris/Illumos“, „Free-“, „Net“ ir „OpenBSD“, „QNX“, „BeOS/Haiku“ ir „Fuchsia OS“ [2]. Be to, jį rasite mobiliuosiuose įrenginiuose, kuriuose veikia „Android“, „Maemo“ arba „Meego“ OS/„Sailfish“ OS, taip pat žaidimų konsolėse, tokiose kaip „PlayStation Portable“, „Dreamcast“ ir „Wii“.





Specifikacija nepaaiškina ELF failų pavadinimo plėtinio. Naudojami įvairūs raidžių deriniai, pvz., .Axf, .bin, .elf, .o, .prx, .puff, .ko, .so ir .mod arba jų nėra.

ELF failo struktūra

„Linux“ terminale komanda man elf pateikia jums patogią ELF failo struktūros santrauką:



1 sąrašas: ELF struktūros puslapis

$ vyras vienuolika

ELF (5) „Linux“ programuotojo vadovas ELF (5)

VARDAS
elf - vykdomojo ir susiejamojo formato (ELF) failų formatas

SINOPSĖ
#įtraukti

APIBŪDINIMAS
Antraštės failas apibrėžia vykdomosios dvejetainės ELF formatą
failus. Tarp šių failų yra įprastų vykdomųjų failų, kuriuos galima perkelti
objektų failus, pagrindinius failus ir bendrinamas bibliotekas.

Vykdomąjį failą, naudojant ELF failo formatą, sudaro ELF antraštė,
po to - programos antraštės lentelė arba sekcijos antraščių lentelė arba abu.
ELF antraštė visada yra failo nulio poslinkyje. Programa
antraštės lentelė ir skyriaus antraštės lentelės poslinkis faile yra
apibrėžta ELF antraštėje. Dvi lentelės apibūdina likusią
bylos ypatybes.

...

Kaip matote iš aukščiau pateikto aprašymo, ELF failą sudaro dvi dalys - ELF antraštė ir failo duomenys. Failų duomenų sekciją gali sudaryti programos antraštės lentelė, kurioje aprašomi nulis ar daugiau segmentų, sekcijos antraštės lentelė, apibūdinanti nulį ar daugiau sekcijų, po kurios pateikiami duomenys, nurodyti programos įrašu lentelės įrašuose, ir sekcijos antraščių lentelė. Kiekviename segmente yra informacijos, kuri yra būtina vykdant failą vykdymo metu, o skyriuose yra svarbių susiejimo ir perkėlimo duomenų. 1 schema tai iliustruoja schematiškai.

ELF antraštė

ELF antraštė yra 32 baitų ilgio ir nurodo failo formatą. Jis prasideda nuo keturių unikalių baitų sekos, kurios yra 0x7F, o po to - 0x45, 0x4c ir 0x46, o tai reiškia tris raides E, L ir F. Be kitų reikšmių, antraštėje taip pat nurodoma, ar tai yra ELF failas, skirtas 32 ar 64 bitų formatas, naudoja mažai ar labai daug pastangų, rodo ELF versiją ir tai, kuriai operacinei sistemai failas buvo sudarytas, kad galėtų sąveikauti su tinkama programos dvejetaine sąsaja (ABI) ir procesoriaus instrukcijų rinkiniu.

Dvejetainio failo prisilietimo šešiakampis atrodo taip:

. 2 sąrašas: dvejetainio failo šešiakampis

$ hd/usr/bin/touch | galva -5
00000000 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 | .AŠ ........... |
00000010 02 00 3e 00 01 00 00 00 e3 25 40 00 00 00 00 | ..> ......% @ ..... |
00000020 40 00 00 00 00 00 00 00 28 e4 00 00 00 00 00 | @ ....... (....... |
00000030 00 00 00 00 40 00 38 00 09 00 40 00 1b 00 1a 00 | [apsaugotas el. paštas] @..... |
00000040 06 00 00 00 05 00 00 00 40 00 00 00 00 00 00 | [apsaugotas el. paštas] |

„Debian GNU/Linux“ siūlo „readelf“ komandą, pateiktą GNU „binutils“ pakete. Kartu su jungikliu -h (trumpa versija –file -header) gražiai rodoma ELF failo antraštė. 3 sąrašas tai iliustruoja komandų paspaudimu.

. 3 sąrašas: rodomas ELF failo antraštė

$ readelf -h/usr/bin/touch
ELF antraštė:
Magija: 7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00
Klasė: ELF64
Duomenys: 2 papildas, mažas endianas
Versija: 1 (dabartinė)
OS / ABI: UNIX - V sistema
ABI versija: 0
Tipas: EXEC (vykdomasis failas)
Mašina: pažangūs mikro įrenginiai X86-64
Versija: 0x1
Įėjimo taško adresas: 0x4025e3
Programos antraščių pradžia: 64 (baitai į failą)
Skilties antraščių pradžia: 58408 (baitai į failą)
Vėliavos: 0x0
Šios antraštės dydis: 64 (baitai)
Programos antraščių dydis: 56 (baitai)
Programų antraščių skaičius: 9
Skyrių antraščių dydis: 64 (baitai)
Skyrių antraščių skaičius: 27
Skilties antraštės eilutės lentelės rodyklė: 26

Programos antraštė

Programos antraštėje rodomi vykdymo metu naudojami segmentai ir nurodoma sistemai, kaip sukurti proceso vaizdą. 2 sąrašo antraštė rodo, kad ELF failą sudaro 9 programų antraštės, kurių kiekvieno dydis yra 56 baitai, o pirmoji antraštė prasideda 64 baitu.

Vėlgi, „readelf“ komanda padeda išgauti informaciją iš ELF failo. Perjungiklis -l (sutrumpintai –program -headers arba –segments) atskleidžia daugiau informacijos, kaip parodyta 4 sąraše.

. 4 sąrašas: Rodyti informaciją apie programų antraštes

$ readelf -l/usr/bin/touch

Elf failo tipas yra EXEC (vykdomasis failas)
Įėjimo taškas 0x4025e3
Yra 9 programų antraštės, pradedant nuo 64 poslinkio

Programos antraštės:
Įveskite Offset VirtAddr PhysAddr
FileSiz MemSiz vėliavos lygiuoti
PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040
0x00000000000001f8 0x00000000000001f8 R E 8
INTERPO 0x0000000000000238 0x0000000000400238 0x0000000000400238
0x000000000000001c 0x000000000000001c R 1
[Prašomas programos vertėjas: /lib64/ld-linux-x86-64.so.2]
PAKROVTI 0x0000000000000000 0x0000000000400000 0x0000000000400000
0x000000000000d494 0x000000000000d494 R E 200000
ĮKROVTI 0x000000000000de10 0x000000000060de10 0x0000000000606010
0x0000000000000524 0x0000000000000748 200 000 RW
DYNAMIC 0x000000000000de28 0x000000000060de28 0x0000000000606028
0x00000000000001d0 0x00000000000001d0 RW 8
PASTABA 0x0000000000000254 0x0000000000400254 0x0000000000400254
0x0000000000000044 0x0000000000000044 R 4
GNU_EH_FRAME 0x000000000000bc40 0x000000000040bc40 0x000000000040bc40
0x00000000000003a4 0x00000000000003a4 R 4
GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000
0x0000000000000000 0x0000000000000000 RW 10
GNU_RELRO 0x000000000000de10 0x000000000060de10 0x000000000060de10
0x00000000000001f0 0x00000000000001f0 R 1

Skyrių iki segmentų susiejimas:
Segmentų segmentai ...
00
01 .interp
02 .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini. rodata .eh_frame_hdr .eh_frame
03 .init_array .fini_array .jcr .dynamic .got .got.plt .data .bss
04 .dinaminis
05 .note.ABI-tag .note.gnu.build-id
06 .eh_frame_hdr
07
08 .init_array .fini_array .jcr .dynamic .got

Skilties antraštė

Trečioji ELF struktūros dalis yra sekcijos antraštė. Jis skirtas išvardyti atskirus dvejetainės dalies skyrius. Jungiklyje -S (sutrumpintai –section -headers arba –sections) pateikiamos įvairios antraštės. Kalbant apie lietimo komandą, yra 27 sekcijų antraštės, o 5 sąraše rodomi tik pirmieji keturi iš jų ir paskutinis. Kiekviena eilutė apima sekcijos dydį, sekcijos tipą, jos adresą ir atminties poslinkį.

.Sąrašas 5: Išsami informacija apie skyrių, kurią atskleidė pats

$ readelf -S/usr/bin/touch
Yra 27 sekcijų antraštės, pradedant nuo poslinkio 0xe428:

Skyrių antraštės:
[Nr] Pavadinimas Tipas Adreso poslinkis
Dydis „EntSize“ vėliavos Nuorodos informacija Lygiuoti
[0] NULL 0000000000000000 00000000
0000000000000000 000000000000000000 0 0 0
[1] .interp PROGBITS 0000000000400238 00000238
000000000000001c 0000000000000000 A 0 0 1
[2] .pastaba. ABI žymė PASTABA 0000000000400254 00000254
0000000000000020 0000000000000000 A 0 0 4
[3] .note.gnu.build-i PASTABA 0000000000400274 00000274
...
...
[26] .shstrtab STRTAB 0000000000000000 0000e334
00000000000000ef 0000000000000000 0 0 1
Raktas į vėliavas:
W (rašyti), A (skirti), X (vykdyti), M (sulieti), S (eilutės), l (didelis)
I (informacija), L (nuorodų tvarka), G (grupė), T (TLS), E (neįtraukti), x (nežinoma)
O (reikalingas papildomas OS apdorojimas) o (konkrečiai OS), p (specifinis procesorius)

ELF failo analizės įrankiai

Kaip jau pastebėjote iš aukščiau pateiktų pavyzdžių, GNU/Linux yra papildyta daugybe naudingų įrankių, padedančių analizuoti ELF failą. Pirmasis kandidatas, į kurį mes žiūrėsime, yra failų programa.

faile rodoma pagrindinė informacija apie ELF failus, įskaitant instrukcijų rinkinio architektūrą, kuriai skirtas perkeliamo, vykdomojo ar bendrinamo objekto failo kodas. 6 sąraše nurodoma, kad/bin/touch yra 64 bitų vykdomasis failas pagal „Linux Standard Base“ (LSB), dinamiškai susietas ir sukurtas GNU/Linux branduolio 2.6.32 versijai.

. 6 sąrašas: pagrindinė informacija naudojant failą

$ file /bin /touch
/bin/touch: ELF 64 bitų LSB vykdomoji programa, x86-64, 1 versija (SYSV), dinamiškai susieta, interpreter/lib64/l,
GNU/Linux 2.6.32, BuildID [sha1] = ec08d609e9e8e73d4be6134541a472ad0ea34502, pašalintas
$

Antrasis kandidatas yra skaitytojas. Jame rodoma išsami informacija apie ELF failą. Jungiklių sąrašas yra palyginti ilgas ir apima visus ELF formato aspektus. Naudojant jungiklį -n (sutrumpintas –notes) 7 sąraše rodomos tik pastabų sekcijos, esančios failo lietime -ABI versijos žyma ir kūrimo ID bitų eilutė.

. 7 sąrašas: rodyti pasirinktas ELF failo dalis

$ readelf -n/usr/bin/touch

Rodomos pastabos, rastos failo poslinkyje 0x00000254, kurių ilgis 0x00000020:
Savininko duomenų dydis Aprašymas
GNU 0x00000010 NT_GNU_ABI_TAG (ABI versijos žyma)
OS: Linux, ABI: 2.6.32

Rodomos pastabos, rastos failo poslinkyje 0x00000274, ilgis 0x00000024:
Savininko duomenų dydis Aprašymas
GNU 0x00000014 NT_GNU_BUILD_ID (unikalus komponavimo ID bitų eilutė)
Komponavimo ID: ec08d609e9e8e73d4be6134541a472ad0ea34502

Atminkite, kad naudojant „Solaris“ ir „FreeBSD“ elfdump programa [7] atitinka readelf. Nuo 2019 m. Nebuvo naujų leidimų ar atnaujinimų nuo 2003 m.

Trečias numeris yra paketas, pavadintas elfutils [6], kuris yra visiškai prieinamas „Linux“. Ji siūlo alternatyvius įrankius GNU Binutils, taip pat leidžia patvirtinti ELF failus. Atminkite, kad visi paketo paslaugų pavadinimai prasideda „elf utils“.

Paskutinis, bet ne mažiau svarbus dalykas yra objdump. Šis įrankis yra panašus į „readelf“, tačiau daugiausia dėmesio skiria objektų failams. Jame pateikiama panaši informacija apie ELF failus ir kitus objektų formatus.

. 8 sąrašas: „Objdump“ išgauta failo informacija

$ objdump -f /bin /touch

/bin/touch: failo formatas elf64-x86-64
architektūra: i386: x86-64, vėliavos 0x00000112:
EXEC_P, HAS_SYMS, D_PAGED
pradžios adresas 0x00000000004025e3

$

Taip pat yra programinės įrangos paketas „elfkickers“ [9], kuriame yra įrankiai ELF failo turiniui skaityti ir juo manipuliuoti. Deja, išleidimų skaičius yra gana mažas, todėl mes tai tik paminime ir nepateikiame tolesnių pavyzdžių.

Vietoj to, kaip kūrėjas, galite pažvelgti į „pax-utils“ [10,11]. Šiame paslaugų rinkinyje yra daugybė įrankių, padedančių patvirtinti ELF failus. Pavyzdžiui, „dumpelf“ analizuoja ELF failą ir grąžina C antraštės failą, kuriame yra išsami informacija - žr. 2 paveikslą.

Išvada

Dėl išmanaus dizaino ir puikios dokumentacijos derinio ELF formatas veikia labai gerai ir po 20 metų vis dar naudojamas. Aukščiau pateiktos komunalinės paslaugos leidžia jums pamatyti ELF failą ir išsiaiškinti, ką daro programa. Tai yra pirmieji programinės įrangos analizės žingsniai - laimingas įsilaužimas!

Nuorodos ir nuorodos
Padėkos

Rašytojas norėtų padėkoti Axeliui Beckertui už paramą rengiant šį straipsnį.