GOT e PLT
Last updated
Last updated
Quero te mostrar a base primeiro para depois vocΓͺ ver a real necessidade da GOT e PLT, seja muito bem vindo e boa leitura.
BinΓ‘rio EstΓ‘tico: executa por conta prΓ³pria, nΓ£o depende de libc nem nada, tudo que ele necessita ele mesmo tem BinΓ‘rio DinΓ’mico: necessita de algo para executar, como por exemplo da libc, vamos supor que meu binΓ‘rio apenas exibe uma mensagem na tela com o puts(), o puts nΓ£o fui eu que escrevi, ele estΓ‘ presente na libc, ou seja, para o meu programa funcionar eu preciso da libc, o linker faz o processo de linkagem da puts() com o meu programa
Mas o por que disso disso? Simples, imagine, se não houvesse a libc o trabalho que seria escrever todas as funçáes que conhecemos, e outra, imagina se houvesse uma atualização em alguma dessas funçáes, TODOS os binÑrios do mundo inteiro teriam que ser alterados, pois é, a vida sem o libc seria Ñrdua. Com a libc tudo fica mais fÑcil, houve uma atualização/modificação? Basta alterar a libc, o linker vai continuar pegando as funçáes e linkando com o seu binÑrio.
Antes de prosseguir quero te mostrar que o binΓ‘rio Γ© dependente da libc (claro, se ele for dinΓ’mico, sendo sincero nunca vi uma binΓ‘rio estΓ‘tico, mas deve existir algum):
Na segunda linha vocΓͺ pode notar que hΓ‘ uma dependΓͺncia da libc, e na terceira linha temos o linker usado, acredite em mim, vocΓͺ nΓ£o vai querer apagar a sua libc, isso resultaria em um kernel panic provavelmente irreversΓvel, o ls cd etc, comandos do linux nΓ£o funcionariam mais, digo isso porque jΓ‘ apaguei a minha libc e mesmo com ela em mΓ£os colocando novamente no lugar que ela pertence atrΓ‘ves do windows, nΓ£o consegui mais acessar meu linux, resumo, tive que formatar o computador.
Enfim, vocΓͺ jΓ‘ viu sobre binΓ‘rios estΓ‘ticos e dinΓ’micos, agora vamos falar sobre o lazy binding, isso tem mais a ver com o linker Lazy Binding: irΓ‘ resolver os endereΓ§os, linka-los, apenas quando for chamado Isso ajuda em diversos fatores mas o principal deles: desempenho e tempo de compilação menor, mas claro que irΓ‘ atrapalhar um pouco no desempenho do programa. Obs: se o RELRO estiver FULL, os endereΓ§os sΓ£o resolvidos antes da execução e a GOT tem sua permissΓ£o setada apenas para read-only, o que impede qualquer tipo de hook
Como fazemos para resolver os endereços, o que eu quero dizer é que antes do programa ser executados não temos o endereço da puts da libc por exemplo, isso vai ficar mais facil com exemplos.
Veja que no meu exemplo eu simplesmente printo na tela Hello World! Uso no meu código a puts(), função da libc, não fui eu que escrevi a puts, ela estÑ presente na libc, eu estou apenas usando ela, como acessamos ela? Precisamos do endereço dela certo? Correto, mas como o linker faz isso em tempo de execução veremos a seguir, vou explicar primeiro na teoria e depois vou explicar com exemplos.
A PLT (procedure linkage table) tem uma instrução de jmp que pula para a GOT (global offset table), o linker irÑ resolver o endereço e mandarÑ para .got.plt, resumindo: => PLT: é responsÑvel por armazenar o endereço que saltarÑ para a GOT para ser resolvido => GOT: aqui temos os offsets das funçáes presentes na libc, aqui também é usado para chamar o linker para resolver o endereço => .got.plt: com o endereço resolvido ele é armazenado na .got.plt
E depois? Simples, com o endereΓ§o jΓ‘ resolvido quando for chamar a mesma função depois bastar chamar func@plt, a plt terΓ‘ um ponteiro para .got.plt que jΓ‘ terΓ‘ a função, tentei ser o mais clarso possΓvel, vamos ver isso na prΓ‘tica em um binΓ‘rio de 32 bits, cujo o cΓ³digo Γ© aquele mencionado lΓ‘ em cima.
Veja na main+37 a chamada para puts@plt, vamos confirmar o endereço da PLT com o objdump:
Ele da um call justamente no 0x1040, perfeito até aqui, lembrando que estamos vendo isso antes de resolver o endereço, vamos dar uma olhado nesse endereço:
Perceba que em ebx+0xc terÑ o nosso ponteiro para a função puts, ele ainda não estÑ lÑ porque não executamos ainda a puts, vamos executar e ver isso
Eu coloquei um breakpoint bem depois da puts para que eu pudesse analisar, enfim, vemos que o endereço da puts@plt jÑ mudou, vamos ver o que tem nele
Vamos com calma, no primeiro comando podemos ver que nΓ£o mudou muita coisa, mas perceba que ebx+0xc agora foi resolvido vamos ver o endereΓ§o que tem nele jΓ‘ que ele Γ© um ponteiro, ele estΓ‘ apontando para 0xf7e19c0, demos um x/5i que pega 5 instruçáes do endereΓ§o, e nele estΓ‘ justamente a nossa puts, se vocΓͺ quiser dar um disas no endereΓ§o da puts() fique a vontade mas Γ© bem grandinho por isso peguei apenas 5 instruçáes.
Se mesmo assim ficou confuso olhe esse pequeno exemplo:
Falamos sobre GOT, PLT e .got.plt mas o que elas sΓ£o? Elas sΓ£o sessΓ΅es, antes de sessΓ΅es temos segmentos, veja um simples mapa:
Outras seçáes interessantes: => .symtab: Essa seção guarda todos os simbolos internos e externos => .dynsym: Essa seção guarda todos os simbolos externos *Ex: na dynsym tem o simbolo do printf [ printf(βoiβ); ] β¦: na symtab tem o simbolo da main [ int main(){return 0} ]