加入收藏 | 设为首页 | 会员中心 | 我要投稿 我爱资讯网 (https://www.52junxun.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 搭建环境 > Unix > 正文

Linux下的lds链接脚本详解

发布时间:2023-02-06 13:29:36 所属栏目:Unix 来源:
导读:  一、 概论

  每一个链接过程都由链接脚本(linker script, 一般以lds作为文件的后缀名)控制.链接脚本主要用于规定如何把输入文件内的section放入输出文件内, 并控制输出文件内各部分在程序地址空间内的布局
  一、 概论
 
  每一个链接过程都由链接脚本(linker script, 一般以lds作为文件的后缀名)控制.链接脚本主要用于规定如何把输入文件内的section放入输出文件内, 并控制输出文件内各部分在程序地址空间内的布局. 但你也可以用连接命令做一些其他事情.
 
  连接器有个默认的内置连接脚本, 可用ld –verbose查看. 连接选项-r和-N可以影响默认的连接脚本(如何影响?).
 
  -T选项用以指定自己的链接脚本, 它将代替默认的连接脚本。你也可以使用以增加自定义的链接命令.
 
  以下没有特殊说明,连接器指的是静态连接器.
 
  二、基本概念
 
  链接器把一个或多个输入文件合成一个输出文件.
 
  输入文件: 目标文件或链接脚本文件.
 
  输出文件: 目标文件或可执行文件.
 
  目标文件(包括可执行文件)具有固定的格式, 在UNIX或GNU/Linux平台下, 一般为ELF格式
 
  有时把输入文件内的section称为输入section(input section), 把输出文件内的section称为输出section(output sectin).
 
  目标文件的每个section至少包含两个信息:名字和大小. 大部分section还包含与它相关联的一块数据, 称为section contents(section内容). 一个section可被标记为“loadable(可加载的)”或“allocatable(可分配的)”.
 
  loadable section:在输出文件运行时, 相应的section内容将被载入进程地址空间中.
 
  allocatable section:内容为空的section可被标记为“可分配的”.在输出文件运行时, 在进程地址空间中空出大小同section指定大小的部分. 某些情况下, 这块内存必须被置零.
 
  如果一个section不是“可加载的”或“可分配的”, 那么该section通常包含了调试信息. 可用objdump -h命令查看相关信息.
 
  每个“可加载的”或“可分配的”输出section通常包含两个地址:VMA(virtual memory address虚拟内存地址或程序地址空间地址)和LMA(load memory address加载内存地址或进程地址空间地址).通常VMA和LMA是相同的.
 
  在目标文件中, loadable或allocatable的输出section有两种地址:VMA(virtual Memory Address)和LMA(Load Memory Address). VMA是执行输出文件时section所在的地址, 而LMA是加载输出文件时section所在的地址. 一般而言, 某section的VMA == LMA. 但在嵌入式系统中, 经常存在加载地址和执行地址不同的情况: 比如将输出文件加载到开发板的flash中(由LMA指定), 而在运行时将位于flash中的输出文件复制到SDRAM中(由VMA指定).
 
  可这样来理解VMA和LMA, 假设:
 
  (1) .data section对应的VMA地址是0×08050000, 该section内包含了3个32位全局变量, i、j和k, 分别为1,2,3.
 
  (2) .text section内包含由”printf( “j=%d “, j );”程序片段产生的代码.
 
  连接时指定.data section的VMA为0×08050000, 产生的printf指令是将地址为0×08050004处的4字节内容作为一个整数打印出来。
 
  如果.data section的LMA为0×08050000,显然结果是j=2
 
  如果.data section的LMA为0×08050004unix路径简化,显然结果是j=1
 
  还可这样理解LMA:
 
  .text section内容的开始处包含如下两条指令(intel i386指令是10字节,每行对应5字节):
 
  jmp 0×08048285
 
  movl $0×1,%eax
 
  如果.text section的LMA为0×08048280, 那么在进程地址空间内0×08048280处为“jmp 0×08048285”指令, 0×08048285处为movl $0×1,%eax指令. 假设某指令跳转到地址0×08048280, 显然它的执行将导致%eax寄存器被赋值为1.
 
  如果.text section的LMA为0×08048285, 那么在进程地址空间内0×08048285处为“jmp 0×08048285”指令, 0×0804828a处为movl $0×1,%eax指令. 假设某指令跳转到地址0×08048285, 显然它的执行又跳转到进程地址空间内0×08048285处, 造成死循环.
 
  符号(symbol): 每个目标文件都有符号表(SYMBOL TABLE), 包含已定义的符号(对应全局变量和static变量和定义的函数的名字)和未定义符号(未定义的函数的名字和引用但没定义的符号)信息.
 
  符号值: 每个符号对应一个地址, 即符号值(这与c程序内变量的值不一样, 某种情况下可以把它看成变量的地址). 可用nm命令查看它们. (nm的使用方法可参考本blog的GNU binutils笔记)
 
  三、 脚本格式
 
  链接脚本由一系列命令组成, 每个命令由一个关键字(一般在其后紧跟相关参数)或一条对符号的赋值语句组成. 命令由分号‘;’分隔开.
 
  文件名或格式名内如果包含分号’;'或其他分隔符, 则要用引号‘”’将名字全称引用起来. 无法处理含引号的文件名.
 
  /* */之间的是注释。
 
  四、 简单例子
 
  在介绍链接描述文件的命令之前, 先看看下述的简单例子:
 
  以下脚本将输出文件的text section定位在0×10000, data section定位在0×8000000:
 
  SECTIONS
 
  {
 
  . = 0×10000;
 
  .text : {*(.text)}
 
  . = 0×8000000;
 
  .data : { *(.data) }
 
  .bss : { *(.bss) }
 
  }
 
  解释一下上述的例子:
 
  . = 0×10000: 把定位器符号置为0×10000 (若不指定, 则该符号的初始值为0).
 
  .text: { *(.text) } : 将所有(*符号代表任意输入文件)输入文件的.text section合并成一个.text section, 该section的地址由定位器符号的值指定, 即0×10000.
 
  . = 0×8000000:把定位器符号置为0×8000000
 
  .data: { *(.data) } : 将所有输入文件的.data section合并成一个.data section, 该section的地址被置为0×8000000.
 
  .bss: { *(.bss) } : 将所有输入文件的.bss section合并成一个.bss section,该section的地址被置为0×8000000+.data section的大小.
 
  连接器每读完一个section描述后, 将定位器符号的值*增加*该section的大小. 注意: 此处没有考虑对齐约束.
 

(编辑:我爱资讯网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章