2023年12月25日发(作者:)
com 文件和 exe 文件的区别.com文件和.exe文件的区别2011-03-25 00:15 COM文件:
.COM文件包含程序的一个绝对映象--就是说,为了运行程序准确的处理器指令和内存中的数据,MS-DOS通过直接把该映象从文件拷贝到内存而加载.COM程序;它不作任何改变.为加载一个.COM程序,MS-DOS首先试图分配内存,因为.COM程序必须位于一个64K的段中,所以.COM文件的大小不能超过65,024(64K减去用于PSP的256字节和用于一个起始堆栈的至少256字节).如果MS-DOS不能为程序,一个PSP,一个起始堆栈分配足够内存,则分配尝试失败.否则,MS-DOS分配尽可能多的内存(直至所有保留内存),即使.COM程序本身不能大于64 K.在试图运行另一个程序或分配另外的内存之前,大部分.COM程序释放任何不需要的内存.分配内存后,MS-DOS在该内存的头256字节建立一个PSP,如果PSP中的第一个FCB含有一个有效驱动器标识符,则置AL为00h,否则为-DOS还置AH为00h或0FFh,这依赖于第二个FCB是否含有一个有效驱动器标识符.建造PSP后,MS-DOS在PSP后立即开始(偏移100h)加载.COM文件,它置SS,DS和ES为PSP的段地址,接着创建一个堆栈.为创建一个堆栈,MS-DOS置SP为0000h,若已分配了至少64K内存;否则,它置寄存器为比所分配的字节总数大2的值.最后,它把0000h推进栈,这是为了保证与在早期MS-DOS版本上设计的程序的兼容性.MS-DOS通过把控制传递偏移100h处的指令而启动程序.程序设计者必须保证.COM文件的第一条指令是程序的入口点.注意,因为程序是在偏移100h处加载,因此所有代码和数据偏移也必须相对于100h.汇编语言程序设计者可通过置程序的初值为100h而保证这一点(例如通过在原程序的开始使用语句org 100h)
.EXE文件包含一个文件头和一个可重定位程序映象.文件头包含MS-DOS用于加载程序的信息,例如程序的大小和寄存器的初始值.文件头还指向一个重定位表,该表包含指向程序映象中可重定位段地址的指针链表.文件头的形式与EXEHEADER结构对应:
EXEHEADER STRUC exSignature dw 5A4Dh;.EXE标志
exExraBytes dw?;最后(部分)页中的字节数
exPages dw?;文件中的全部和部分页数
exRelocItems dw?;重定位表中的指针数
exHeaderSize dw?;以字节为单位的文件头大小
exMinAlloc dw?;最小分配大小
exMaxAlloc dw?;最大分配大小
exInitSS dw?;初始SS值
exInitSP dw?;初始SP值
exChechSum dw?;补码校验值
exInitIP dw?;初始IP值
exInitCS dw?;初始CS值
exRelocTable dw?;重定位表的字节偏移量
exOverlay dw?;覆盖号
EXEHEADER ENDS
程序映象,包含处理器代码和程序的初始数据,紧接在文件头之后.它的大小,以字节为单位,等于.EXE文件的大小减去文件头的大小,也等于exHeaderSize的域的值乘以-DOS通过把该映象直接从文件拷贝到内存加载.EXE程序然后调整定位表中说明的可重定位段地址.
定位表是一个重定位指针数组,每个指向程序映象中的可重定位段地址.文件头中的exRelocItems域说明了数组中指针的个数,exRelocTable域说明了分配表的起始文件偏移量.每个重定位指针由两个16位值组成:偏移量和段值.为加载.EXE程序,MS-DOS首先读文件头以确定.EXE标志并计算程序映象的大小,
然后它试图申请内存.首先,它计算程序映象文件的大小加上PSP的大小再加上EXEHEADER结构中的exMinAlloc域说明的内存大小这三者之和,如果总和超过最大可用内存块的大小,则MS-DOS停止加载程序并返回一个出错值.否则,它计算程序映象的大小加上PSP的大小再加上EXEHEADER结构中exMaxAlloc域说明的内存大小之和,如果第二个总和小于最大可用内存块的大小,则MS-DOS分配计算得到的内存量.否则,它分配最大可用内存块.分配完内存后,MS-DOS确定段地址;也称为起始段地址,MS-DOS从此处加载程序映象.如果exMinAlloc域和exMaxAlloc域中的值都为零,则MS-DOS把映象尽可能地加载到内存最高端.否则,它把映象加载到紧挨着PSP域之上.接下来,MS-DOS读取重定位表中的项目调整所有由可重定位指针说明的段地址.对于重定位表中的每个指针,MS-DOS寻找程序映象中相应的可重定位段地址,并把起始段地址加到它之上.一旦调整完毕,段地址便指向了内存中被加载程序的代码和数据段.MS-DOS在所分配内存的最低部分建造256字节的PSP,把AL和AH设置为加载.COM程序时所设置的值.MS-DOS使用文件头中的值设置SP与SS,调整SS初始值,把起始地址加到它之上.MS-DOS还把ES和DS设置为PSP的段地址.最后,MS-DOS从程序文件头读取CS和IP的初始值,把起始段地址加到CS之上,把控制转移到位于调整后地址处的程序.
在dos下,可执行程序都是由外壳程序进行加载,运行完成后再返回外壳程序,exe文件中的程序执行过程如下:
1.由其他程序(Debug,command(shell程序))将exe文件中的程序加载入内存;
2.设置CS:IP指向程序第一条要执行的指令(即程序的入口地址),从而使程序可以运行
3.程序运行结束后,返回到加载者
所以程序是从程序被加载进入内存后,第一次设定的CS:IP指向的内存处开始执行的
COM文件
COM文件只有一个分段,无堆栈段,程序长度小于64KB。程序必须预留100H空间,且在位移100H处是一条可执行指令。
程序中的子程序必须具有近过程属性(NEAR)。该程序被加载的起始标号必须由END语句说明为开始地址。
DOS将一个COM文件装入内存时,寄存器CS、DS、ES、SS指向PSP的起始地址:代码装入程序段偏移量为100H处。如下图所示。
┏━━━━━━━┓←CS=DS=ES=SS
┃PSP(100H)┃
┃┃
┣━━━━━━━┫←CS:100H
┃┃
┃程序┃
┃┃
┃┃
┗━━━━━━━┛
EXE文件
有多个分段。程序长度受当前内存可用空间的限制。程序的起始标号与END语句说明的开始地址一致。程序中的子程序既可为NEAR,也可为FAR。
┏━━━━━━━┓←DS=ES
┃PSP(100H)┃
┃┃
┣━━━━━━━┫←CS
┃┃
┃程序┃←CS:IP
┃┃程序入口
┃┃
┗━━━━━━━┛
DS、ES:指向PSP起始地址
CS:IP:程序的执行入口
SS:SP:指向堆栈段
以COM为扩展名的文件的特点如下:
1.程序只能设置一个段,且不建立堆栈段;
2.程序的长度必须少于64K字节;
3.程序必须预留100H空间,开始处是一条可执行指令;
4.程序被装入的起始标号必须由END语句说明开始地址;
5.程序中的子程序必须具有近程属性(NEAR);
6.如果COM文件是由几个不同的目标模块链接生成的,要求所有目标模块具有同一代码段名和类别名(CLASS),且赋予公共属性(PUBLIC),而主模块应具有100H的入口指针并优先连接。
EXE文件的结构特点如下:
1.程序允许建立若干不同名的代码段、数据段、堆栈段或附加段。
2.程序的长度仅受当前内存可用空间的限制。
3.程序的入口随应用而定,只需起始标号与END语句说明的起始地址一致。
4.程序中的各个子程序的属性随段内或段间调用而定为NEAR或FAR。
5.连接生成EXE文件的各个不同的目标模块内的代码段,数据段或附加段可取同名或独立命名。但要求只有主模块的END语句指出程序入口的起始标号,并至少有一个具有STACK属性的堆栈段。
com和exe的主要区别只有一个:com程序没有头部控制信息,只有二进制代码;EXE程序会有一个头部控制信息,控制EXE的二进制代码。
这个主要区别就决定了他们之间会有许多的差别:
1:COM程序的入口地址是固定的,为100h;exe程序的人口地址可以随意,由end后面的标号决定。
2:COM程序的数据和代码段是混合在一起的,因为COM没有能力识别数据段开始的位置。
3:COM程序只能有一个代码段,而不能有更多,这也决定了COM程序的大小最多为64K。
从本质上来看,COM和EXE保存的都是机器代码。因此,我们在某些情况下,把EXE程序的头部去了,并做适当的修改,就可以转化为COM程序;COM程序加多一个头部,就可以变成EXE程序。
EXE程序可以分为DOS下的EXE程序和WINDOWS下的EXE程序,两种程序的头部结构是不同的。其中WINDOWS下的EXE程序是采用PE结构的。


发布评论