2023年12月25日发(作者:)

com 文件和 exe 文件的区别.com文件和.exe文件的区别2011-03-25 00:15 COM文件:

.COM文件包含程序的一个绝对映象--就是说,为了运行程序准确的处理器指令和内存中的数据,MS-DOS通过直接把该映象从文件拷贝到内存而加载.COM程序;它不作任何改变.为加载一个.COM程序,MS-DOS首先试图分配内存,因为.COM程序必须位于一个64K的段中,所以.COM文件的大小不能超过65,024(64K减去用于PSP的256字节和用于一个起始堆栈的至少256字节).如果MS-DOS不能为程序,一个PSP,一个起始堆栈分配足够内存,则分配尝试失败.否则,MS-DOS分配尽可能多的内存(直至所有保留内存),即使.COM程序本身不能大于64 K.在试图运行另一个程序或分配另外的内存之前,大部分.COM程序释放任何不需要的内存.分配内存后,MS-DOS在该内存的头256字节建立一个PSP,如果PSP中的第一个FCB含有一个有效驱动器标识符,则置AL为00h,否则为-DOS还置AH为00h或0FFh,这依赖于第二个FCB是否含有一个有效驱动器标识符.建造PSP后,MS-DOS在PSP后立即开始(偏移100h)加载.COM文件,它置SS,DS和ES为PSP的段地址,接着创建一个堆栈.为创建一个堆栈,MS-DOS置SP为0000h,若已分配了至少64K内存;否则,它置寄存器为比所分配的字节总数大2的值.最后,它把0000h推进栈,这是为了保证与在早期MS-DOS版本上设计的程序的兼容性.MS-DOS通过把控制传递偏移100h处的指令而启动程序.程序设计者必须保证.COM文件的第一条指令是程序的入口点.注意,因为程序是在偏移100h处加载,因此所有代码和数据偏移也必须相对于100h.汇编语言程序设计者可通过置程序的初值为100h而保证这一点(例如通过在原程序的开始使用语句org 100h)

.EXE文件包含一个文件头和一个可重定位程序映象.文件头包含MS-DOS用于加载程序的信息,例如程序的大小和寄存器的初始值.文件头还指向一个重定位表,该表包含指向程序映象中可重定位段地址的指针链表.文件头的形式与EXEHEADER结构对应:

EXEHEADER STRUC exSignature dw 5A4Dh;.EXE标志

exExraBytes dw?;最后(部分)页中的字节数

exPages dw?;文件中的全部和部分页数

exRelocItems dw?;重定位表中的指针数

exHeaderSize dw?;以字节为单位的文件头大小

exMinAlloc dw?;最小分配大小

exMaxAlloc dw?;最大分配大小

exInitSS dw?;初始SS值

exInitSP dw?;初始SP值

exChechSum dw?;补码校验值

exInitIP dw?;初始IP值

exInitCS dw?;初始CS值

exRelocTable dw?;重定位表的字节偏移量

exOverlay dw?;覆盖号

EXEHEADER ENDS

程序映象,包含处理器代码和程序的初始数据,紧接在文件头之后.它的大小,以字节为单位,等于.EXE文件的大小减去文件头的大小,也等于exHeaderSize的域的值乘以-DOS通过把该映象直接从文件拷贝到内存加载.EXE程序然后调整定位表中说明的可重定位段地址.

定位表是一个重定位指针数组,每个指向程序映象中的可重定位段地址.文件头中的exRelocItems域说明了数组中指针的个数,exRelocTable域说明了分配表的起始文件偏移量.每个重定位指针由两个16位值组成:偏移量和段值.为加载.EXE程序,MS-DOS首先读文件头以确定.EXE标志并计算程序映象的大小,

然后它试图申请内存.首先,它计算程序映象文件的大小加上PSP的大小再加上EXEHEADER结构中的exMinAlloc域说明的内存大小这三者之和,如果总和超过最大可用内存块的大小,则MS-DOS停止加载程序并返回一个出错值.否则,它计算程序映象的大小加上PSP的大小再加上EXEHEADER结构中exMaxAlloc域说明的内存大小之和,如果第二个总和小于最大可用内存块的大小,则MS-DOS分配计算得到的内存量.否则,它分配最大可用内存块.分配完内存后,MS-DOS确定段地址;也称为起始段地址,MS-DOS从此处加载程序映象.如果exMinAlloc域和exMaxAlloc域中的值都为零,则MS-DOS把映象尽可能地加载到内存最高端.否则,它把映象加载到紧挨着PSP域之上.接下来,MS-DOS读取重定位表中的项目调整所有由可重定位指针说明的段地址.对于重定位表中的每个指针,MS-DOS寻找程序映象中相应的可重定位段地址,并把起始段地址加到它之上.一旦调整完毕,段地址便指向了内存中被加载程序的代码和数据段.MS-DOS在所分配内存的最低部分建造256字节的PSP,把AL和AH设置为加载.COM程序时所设置的值.MS-DOS使用文件头中的值设置SP与SS,调整SS初始值,把起始地址加到它之上.MS-DOS还把ES和DS设置为PSP的段地址.最后,MS-DOS从程序文件头读取CS和IP的初始值,把起始段地址加到CS之上,把控制转移到位于调整后地址处的程序.

在dos下,可执行程序都是由外壳程序进行加载,运行完成后再返回外壳程序,exe文件中的程序执行过程如下:

1.由其他程序(Debug,command(shell程序))将exe文件中的程序加载入内存;

2.设置CS:IP指向程序第一条要执行的指令(即程序的入口地址),从而使程序可以运行

3.程序运行结束后,返回到加载者

所以程序是从程序被加载进入内存后,第一次设定的CS:IP指向的内存处开始执行的

COM文件

COM文件只有一个分段,无堆栈段,程序长度小于64KB。程序必须预留100H空间,且在位移100H处是一条可执行指令。

程序中的子程序必须具有近过程属性(NEAR)。该程序被加载的起始标号必须由END语句说明为开始地址。

DOS将一个COM文件装入内存时,寄存器CS、DS、ES、SS指向PSP的起始地址:代码装入程序段偏移量为100H处。如下图所示。

┏━━━━━━━┓←CS=DS=ES=SS

┃PSP(100H)┃

┃┃

┣━━━━━━━┫←CS:100H

┃┃

┃程序┃

┃┃

┃┃

┗━━━━━━━┛

EXE文件

有多个分段。程序长度受当前内存可用空间的限制。程序的起始标号与END语句说明的开始地址一致。程序中的子程序既可为NEAR,也可为FAR。

┏━━━━━━━┓←DS=ES

┃PSP(100H)┃

┃┃

┣━━━━━━━┫←CS

┃┃

┃程序┃←CS:IP

┃┃程序入口

┃┃

┗━━━━━━━┛

DS、ES:指向PSP起始地址

CS:IP:程序的执行入口

SS:SP:指向堆栈段

以COM为扩展名的文件的特点如下:

1.程序只能设置一个段,且不建立堆栈段;

2.程序的长度必须少于64K字节;

3.程序必须预留100H空间,开始处是一条可执行指令;

4.程序被装入的起始标号必须由END语句说明开始地址;

5.程序中的子程序必须具有近程属性(NEAR);

6.如果COM文件是由几个不同的目标模块链接生成的,要求所有目标模块具有同一代码段名和类别名(CLASS),且赋予公共属性(PUBLIC),而主模块应具有100H的入口指针并优先连接。

EXE文件的结构特点如下:

1.程序允许建立若干不同名的代码段、数据段、堆栈段或附加段。

2.程序的长度仅受当前内存可用空间的限制。

3.程序的入口随应用而定,只需起始标号与END语句说明的起始地址一致。

4.程序中的各个子程序的属性随段内或段间调用而定为NEAR或FAR。

5.连接生成EXE文件的各个不同的目标模块内的代码段,数据段或附加段可取同名或独立命名。但要求只有主模块的END语句指出程序入口的起始标号,并至少有一个具有STACK属性的堆栈段。

com和exe的主要区别只有一个:com程序没有头部控制信息,只有二进制代码;EXE程序会有一个头部控制信息,控制EXE的二进制代码。

这个主要区别就决定了他们之间会有许多的差别:

1:COM程序的入口地址是固定的,为100h;exe程序的人口地址可以随意,由end后面的标号决定。

2:COM程序的数据和代码段是混合在一起的,因为COM没有能力识别数据段开始的位置。

3:COM程序只能有一个代码段,而不能有更多,这也决定了COM程序的大小最多为64K。

从本质上来看,COM和EXE保存的都是机器代码。因此,我们在某些情况下,把EXE程序的头部去了,并做适当的修改,就可以转化为COM程序;COM程序加多一个头部,就可以变成EXE程序。

EXE程序可以分为DOS下的EXE程序和WINDOWS下的EXE程序,两种程序的头部结构是不同的。其中WINDOWS下的EXE程序是采用PE结构的。