嵌入式系统可执行文件格式
 

2011-3-15 来源:网络

 
    在一个完好的硬件设备中,必须要有相应的程序才能使整个系统运行起来,我们一般所说的程序,实际上就是存储在硬件设备中的一些可执行代码。
    在嵌入式操作系统中,执行代码主要包括以下几部分:
    1、 嵌入式操作系统
    2、 系统软件
    3、 应用软件
    通用计算机系统的应用软件与操作系统可以分离的,也就说:我们可以单独采购应用软件与操作系统软件,也可以根据不同的需要,在同一操作系统上安装不 同的应用软件以实现不同的功能。在嵌入式系统中,其执行代码大多数时候是与硬件紧密联系在一起的,特定的功能使用不同的操作系统与不同的系统软件与应用软 件,在其产品化以后,一般不能在做改变。而且所有这些可执行代码一般都比较小,统一存储于嵌入式存储设备中,最常用的就是FLASH。
    由于不同的开发环境与不同的硬件架构,存储于嵌入式存储设备中的可执行文件格式也不尽相同,但它们基本上包含以下一些典型的特征:
    可执行文件的一般信息,如:文件大小、创建时间,文件名,文件权限等。
    与硬件处理器架构相关的二进制代码和数据。
    符号表与符号重定位表。
    调试器需要的调试信息与一些下载时需要的一些信息。不同的嵌入式环境中,其组织可执行文件的格式也不相同,主要有以下几种:    ELF文件格式、S-record文件格式、HEX文件格式、bin文件格式
    1、ELF文件格式(Executable and linking format)
    Executable and linking format(ELF)文件是Linux系统 下的一种常用、可移植目标文件(object    file)格式,它有三种主要类型:
    可重定位文件(Relocatable File):包含适合于与其他目标文件链接来创建可执行文件或者共享目标文件的代码和数据。
    可执行文件(Executable File):包含适合于执行的一个程序,此文件规定了exec() 如何创建一个程序的进程映像。
    共享目标文件(Shared Object File):包含可在两种上下文中链接的代码和数据。首先链接编辑器可以将它和其它可重定位文件和共享目标文件一起处理,生成另外一个目标文件。其次,动 态链接器(Dynamic Linker)可能将它与某个可执行文件以及其它共享目标一起组合,创建进程映像。详细信息可以阅读[参考2]。
    2、S-record文件格式
   S-Record文件遵循Motorola制定的格式规范,是一种标准的、可打印格式的文件。S-Record文件是通过对链接器生成的目标程序或 数据进行编码生成的,适用于在计算机平台间传送,也可以在编辑后用于交叉平台间的传送。S-Record文件编码简单,可以通过IDE下载,但无法在线实 时调试。S-Record文件是由多条记录组成的,每条记录都是由5个字段组成的ASCII字符串,格式如下图所示。
  • 记录类型:由两个字符组成,描述了该条记录的可能类型(S0, S1, S2, S3, S5, S7, S8, or S9)。
  • 数据长度:是对应于2 byte十六进制数的一对字符,表示该条记录后续字符对的个数;
  • 地址:由4,6或者8个字符组成,也是由十六进制值翻译得到的字符,给出数据字段将存放在存储器中的地址;
  • 数据:由每2 byte十六进制值翻译得到的成对的字符,大小为0-64,这些十六进制数值可能是存放在存储器中的数据,或者是描述信息;
  • 校验和:它们所对应的十六进制数值是根据除记录类型之外的其他字段字符成对累加之和求反所得;
  • 换行符:每条记录都由换行符终止。针对不同的目标器件,可能每条记录的结束符不尽相同,设计中用传输程序来提供一致的换行符。

所有的S-Record文件都是以类型为S0的记录作为首条记录,这条记录在数据字段中给出文件的信息,包括路径、版本号等,这些信息是供阅读的, 将不被存放到存储器中。S-Record文件的中间记录可能是类型为S1、S2或S3的记录,其地址字段分别对应2、3、4 byte地址,因而主要区别在于寻址空间的不同。S-Record文件以S7、S8或S9类型的记录作为末条记录,除了地址字段长度不同外,它们都给出了 程序执行的起始地址,并都不含数据字段。详细的信息可以阅读[参考1]
    3、bin文件格式
    bin文件就是直接的二进制文件,内部没有地址标记。一般用编程器烧写时,从00开始,而如果下载运行,则下载到编译时的地址即可。
    4、HEX文件格式
    Intel HEX文件是记录文本行的ASCII文本文件,在Intel HEX文件中,每一行是一个HEX记录,由十六进制数组成的机器码或者数据常量。Intel    HEX文件经常被用于将程序或数据传输 存储到ROM、EPROM。大多数编程器和模拟器使用Intel HEX文件。
    一个Intel HEX文件可以包含任意多的十六进制记录,每条记录有五个域,下面是一个记录的格式, :LLaaaatt[dd...]cc    每一组字母是独立的一域,每一个字母是一个十六进制数字,每一域至少由两个十六进制数字组成,下面是字节的描述:     :冒号:它是每一条Intel HEX记录的开始。 LL是这条记录的长度域,他表示数据(dd)的字节数目。     aaaa是地址域:他表示数据的起始地址。 如果是数据记录,这表示将要烧录的这条记录中的数据在EPROM/FLASH中的偏移地址,对于不支持扩展段地址和扩展线性地址的,如89C51,这就是    此条记录的起始地址。 tt这个域表示这条HEX记录的类型,他有可能是下面这几种类型: 00:数据记录 01:文件结束记录    02:扩展段地址记录 04:扩展线性地址记录 dd是数据域:表示一个字节的数据。一个记录可能有多个数据字节,字节数目可以查看LL域的说明。    cc是效验和域:表示记录的效验和,计算方法是将本条记录冒号开始的所有字母对(不包括本效验字和冒号)所表示的十六进制数字都加起来,然后模除256得    到的余数,最后求出余数的补码即是本效验字节cc。
    Intel HEX文件由若干个数据记录组成,一个数据记录以一个回车和一个换行结束,(回车为0x0d换行为0x0a)。
    扩展线性地址记录(HEX386) : 扩展线性地址记录也可称为32位地址记录和HEX386记录,这个纪录包含高16(16-31位)位数据地址,这种扩展的线性记录总是有两个字节数据。当    一个扩展线性地址记录被读到后,扩展线性地址记录的数据区域将被保存并应用到后面从Intel HEX文件中读出的记录,这个扩展线性记录一直有效,    直到读到下一个扩展线性记录。 文件结束记录(EOF) : 一个Intel HEX文件必须有一个文件结束记录,这个记录的类型域必须是01,一个EOF记录总是这样:    :00000001FF,其中:00是记录中数据字节的数目,0000这个地址对于EOF记录来说无任何意义,01记录类型是01(文件结束记录标 示),FF是效验和。计算如下01h + NOT(00h + 00h + 00h + 01h)。
    5、 可执行文件格式的差别:
    a) HEX文件是包括地址信息的,而BIN文件格式只包括了数据本身,在烧写或下载HEX文件的时候,一般都不需要用户指定地址,因为HEX文件内部的信息已经包括了地址。而烧写BIN文件的时候,用户是一定需要指定地址信息的。
    b) BIN文件格式 对二进制文件而言,其实没有”格式”。文件只是包括了纯粹的二进制数据。
    c) HEX文件格式 HEX文件都是由记录(RECORD)组成的。在HEX文件里面,每一行代表一个记录。记录类型包括:记录数据域,文件结束域,扩展线性地址的记录,扩展 段地址的记录。在上面的后2种记录,都是用来提供地址信息的。每次碰到这2个记录的时候,都可以根据记录计算出一个“基”地址。对于后面的数据记录,计算 地址的时候,都是以这些“基”地址为基础的。
    d) AXF是Arm特有的文件格式,它除了包含bin文件外,还额外包括了许多其他调试信息。在下载到目标板的时候,烧入ROM还是bin文件,额外的调试信息会被去掉
    一般来说,可以由elf文件转化为其它两种文件,hex也可以直接转换为bin文件,但是bin要转 化为hex文件必须要给定一个基地址。而hex和bin不能转化为elf文件,因为elf的信息量要大。另外还有一种ads的调试文件axf,它可以用以 下命令fromelf -nodebug xx.axf -bin xx.bin转化为bin文件。

  a.out执行文件格式
  Linux内核0.12版仅支持a.out(Assembly out)执行文件和目标文件的格式,虽然这种格式目前已经渐渐不用,而使用功能更为齐全的ELF(Executable and Link Format)格式,但是由于其简单性,作为入门的学习材料比较适用。下面全面介绍一下a.out格式。
  .out执行文件由7部分(7节)组成。它们依次为:
  (1)执行头部分(exec header)。该部分中含有一些参数(exec结构),内核使用这些参数把执行文件加载到内存中并执行,而链接程序(ld)使用这些参数将一些模块文件组合成一个可执行文件。这是目标文件唯一必要的组成部分。
  (2)代码段部分(text segment)。含有程序执行时被加载到内存中的指令代码和相关数据。可以以只读形式被加载。
  (3)数据段部分(data segment)。这部分含有已经初始化过的数据,总是被加载到可读写的内存中。
  (4)代码重定位部分(text relocations)。这部分含有供链接程序使用的记录数据。在组合目标模块文件时用于定位代码段中的指针或地址。
  (5)数据重定位部分(data relocations)。类似于代码重定位部分的作用,但是用于数据段中指针的重定位。
  (6)符号表部分(symbol table)。这部分同样含有供链接程序使用的记录数据,用于在二进制目标模块文件之间对命名的变量和函数(符号)进行交叉引用。
  (7)字符串表部分(string table)。该部分含有与符号名对应的字符串。



基于模型的整车电子电气架构设计
嵌入式设备上的 Linux 系统开发
Linux 的并发可管理工作队列
ARM嵌入式系统的问题总结分析
嵌入式系统设计与实例开发
WinCE6.0的EBOOT概要
更多...   


UML +RoseRealtime+嵌入式
C++嵌入式系统开发
嵌入式白盒测试
手机软件测试
嵌入式软件测试
嵌入式操作系统VxWorks


中国航空 嵌入式C高质量编程
使用EA和UML进行嵌入式系统分析设计
基于SysML和EA的嵌入式系统建模
上海汽车 嵌入式软件架构设计
北京 嵌入式C高质量编程
北京 高质高效嵌入式开发
Nagra linux内核与设备驱动原理
更多...   
 
 
 
 
 

组织简介 | 联系我们 |   Copyright 2002 ®  UML软件工程组织 京ICP备10020922号

京公海网安备110108001071号