windows环境下32位汇编语言程序设计-第2章

小说： windows环境下32位汇编语言程序设计字数：每页3500字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

会增大　。exe文件的大小。举例说明，如果要用到一个100　KB的缓冲区，可以在数据段中定义：

szBuffer　　　　　　　　　　　　db　　　　　　100　*　1024　dup　（？）

如果放在　。data段中，编译器认为这些数据在程序装入时就必须有效，所以它在生成可执行文件的时候保留了所有的100　KB的内容，即使它们是全零！如果程序其他部分的大小是50　KB，那么最后的　。exe文件就会是150　KB大小，如果缓冲区定义为1　MB，那么　。exe文件会增大到1　050　KB。。data？段则不同，其中的内容编译器会认为程序在开始执行后才会用到，所以在生成可执行文件的时候只保留了大小信息，不会为它浪费磁盘空间。和上面同样的情况下，即使缓冲区定义为1　MB，可执行文件同样只有50　KB！总之，。data？段是未初始化数据段，其中的数据也是可读可写的，但在可执行文件中不占空间，。data？段在可执行文件中存放在_BSS节区中。

第三类数据是一些常量。如一些要显示的字符串信息，它们在程序装入的时候也已经有效，但在整个执行过程中不需要修改，这些数据可以放在　nst段中，nst段是常量段，它是可读不可写的。一般为了方便起见，在小程序中常常把常量一起定义到　。data段中，而不另外定义一个　nst段。在程序中如果不小心写了对　nst段中的数据做写操作的指令，会引起保护错误，Windows会显示一个如图3。2所示的提示框并结束程序。

图3。2　　对　nst段写操作引起的非法操作

如果不怕程序可读性不佳的话，把　nst段中定义的东西混到　de段中去也可以正常使用，因为　de段也是可以读的。

3。　代码段

de段是代码段，所有的指令都必须写在代码段中，在可执行文件中，代码段是放在_TEXT节区中的。Win32环境中的数据段是不可执行的，只有代码段有可执行的属性。对于工作在特权级3的应用程序来说，de段是不可写的，在编DOS汇编程序的时候，好事的程序员往往有个习惯，就是靠改动代码段中的代码来做一些反跟踪的事情，如果企图在Win32汇编下做同样的事情，结果就是和上面同样的“非法操作”。

当然事物总有两面性，在Windows　95下，在特权级0下运行的程序对所有的段都有读写的权利，包括代码段。另外，在优先级3下运行的程序也不是一定不能写代码段，代码段的属性是由可执行文件PE头部中的属性位决定的，通过编辑磁盘上的　。exe文件，把代码段属性位改成可写，那么在程序中就允许修改自己的代码段。一个典型的应用就是一些针对可执行文件的压缩软件和加壳软件，如Upx和Pepact等，这些软件靠把代码段进行变换来达到解压缩或解密的目的，被处理过的可执行文件在执行时需要由解压代码来将代码段解压缩，这就需要写代码段，所以这些软件对可执行文件代码段的属性预先做了修改。

3。1。3　　程序结束和程序入口

在C语言源程序中，程序不必显式地指定程序由哪里开始执行，编译器已经约定好从main（）函数开始执行了。而在汇编源程序中，并没有一个main函数，程序员可以指定从代码段的任何一个地方开始执行，这个地方由程序最后一句的end语句来指定：

end　　　　　＇开始地址＇

这句语句同时表示源程序结束，所有的代码必须在end语句之前。

end　start

上述语句指定程序从start这个标号开始执行。当然，start标号必须在程序的代码段中有所定义。

但是，一个源程序不必非要指定入口标号，这时候可以把开始地址忽略不写，这种情况发生在编写多模块程序的单个模块的时候。当分开写多个程序模块时，每个模块的源程序中也可以包括　。data，。data？，nst和　de段，结构就和上面的Win32　Hello　World一样，只是其他模块最后的end语句必须不带开始地址。当最后把多个模块链接在一起的时候，只能有一个主模块指定入口地址，在多个模块中指定入口地址或者没有一个模块指定了入口地址，链接程序都会报错。

3。1。4　　注释和换行

注释是源程序中不可忽略的一部分，汇编源程序的注释以分号（；）开始，注释既可以在一行的头部，也可以在一行的中间，一行中所有在分号之后的字符全部当做注释处理，但在字符串的定义中包含在引号内的分号不当做是注释的开始。

举例如下：

；这里是注释

call　　　　_PrintChar　　　　　　；这里是注释

szChar　　db　'Hello；　world；'；0dh；0ah　　　；world后面的分号不是注释，后面的才是

当源程序的某一行过长，不利于阅读的时候，可以分行书写，分行的办法是在一行的最后用反斜杠（）做换行符，如：

　　　　　　　　invoke　　MessageBox；NULL；offset　szText；offset　szCaption；MB_OK

可以写为：

　　　　invoke　　MessageBox；

　　　　　　　　Null；　　　　　　　　　　　　　　；父窗口句柄

　　　　　　　　offset　szText；　　　　　；消息框中的文字

　　　　　　　　offset　szCaption；　　；标题文字

　　　　　　　　MB_OK

“一行的最后”指的是最后一个有用的字符，反斜杠后面多几个空格或加上注释并不影响换行符的使用，如上例所示，这一点和makefile文件中换行符的规定有所不同。

　
来源：电子工业出版社　作者：罗云彬　上一页　　　　　　　　　回书目　　　　　　　　　下一页　　　　　　　　　　
上一页　　　　　　　　　回书目　　　　　　　　　下一页　　　　　　　　　　
　　

第3章　使用MASM

3。2　调用API（1）

　　　　
3。2。1　　API是什么

Win32程序是构筑在Win32　API基础上的。在Win32　API中，包括了大量的函数、结构和消息等，它不仅为应用程序所调用，也是Windows自身的一部分，Windows自身的运行也调用这些API函数。

在DOS下，操作系统的功能是通过各种软中断来实现的，如大家都知道int　21h是DOS中断，int　13h和int　10h是BIOS中的磁盘中断和视频中断。当应用程序要引用系统功能时，要把相应的参数放在各个寄存器中再调用相应的中断，程序控制权转到中断中去执行，完成以后会通过iret中断返回指令回到应用程序中。如DOS汇编下的Hello　World程序中有下列语句：

　　　　mov　　　　　ah；9

　　　　mov　　　　　dx；offset　szHello

　　　　int　　　　　21h

这3条语句调用DOS系统模块中的屏幕显示功能，功能号放在ah中，9号功能表示屏幕显示，要输出到屏幕上的内容的地址放在dx中，然后去调用int　21h，字符串就会显示到屏幕上。

这个例子说明了应用程序调用系统功能的一般过程。首先，系统提供功能模块并约定参数的定义方法，同时约定调用的方式，应用程序按照这个约定来调用系统功能。在这里，ah中放功能号9，dx中放字符串地址就是约定的参数，int　21h是约定的调用方式。

下面来看看这种方法的不便之处。首先，所有的功能号定义是冷冰冰的数字，int　21h的说明文档是这样的：

Int　21　Functions：

　

00——Program　termination

01——Keyboard　input

02——Display　output

03——AUX　input

04——AUX　output

05——Printer　output

06——Direct　console　I/O

07——Direct　STDIN　input；　no　echo

08——Keyboard　input；　no　echo

09——Print　string

0A——Buffered　keyboard　input

0B——Check　standard　input　status

再进入09号功能看使用方法：

Print　string　（Func　09）

　　　　AH　=　09h

　　　　DS：DX　…》　string　terminated　by　〃〃

这就是DOS时代汇编程序员都有一厚本《中断大全》的原因，因为所有的功能编号包括使用的参数定义仅从字面上看，是看不出一点头绪来的。

另外，80x86系列处理器能处理的中断最多只能有256个，不同的系统服务程序使用了不同的中断号，这少得可怜的中断数量就显得太少了，结果到最后是中断挂中断，大家抢来抢去的，把好好的一个系统搞得像接力赛跑一样。

对于这些弱点，程序员们都有个愿望：系统功能如果能以功能名称作为子程序名直接调用就好了，参数也最好定义的有意义一点，这样一来写程序就会方便得多，编系统扩展模块也就不必老是担心往哪个中断上面挂了，最好能把上面int　21h/ah=9的调用写成下面这副样子：

call　　　　PrintString；addr　szHello

终于，好消息出来了，Win32环境中的编程接口就是这个样子，这就是API，它实际上是以一种新的方法代替了DOS中用软中断的方式。和DOS的结构相比，Win32的系统功能模块放在Windows的动态链接库（DLL）中，DLL是一种Windows的可执行文件，采用的是和　。exe文件同样的PE格式，在PE格式文件头的导出表中，以字符串形式指出了这个DLL能提供的函数列表。应用程序使用字符串类型的函数名指定要调用的函数。

应用程序在使用的时候由Windows自动装入DLL程序并调用相应的函数。

实际上，Win32的基础就是由DLL组成的。Win32　API的核心由3个DLL提供，它们是：

●　　　KERNEL32。DLL——系统服务功能。包括内存管理、任务管理和动态链接等。

●　　　GDI32。DLL——图形设备接口。利用VGA与DRV之类的显示设备驱动程序完成显示文本和矩形等功能。

●　　　USER32。DLL——用户接口服务。建立窗口和传送消息等。

当然，Win32　API还包括其他很多函数，这些也是由DLL提供的，不同的DLL提供了不同的系统功能。如使用TCP/IP协议进行网络通信的DLL是Wsock32。dll，它所提供的API称为Socket　API；专用于电话服务方面的API称为TAPI（Telephony　API），包含在Tapi32。dll中。所有的这些DLL提供的函数组成了现在所用的Win32编程环境。

　

3。2。2　　调用API

和在DOS中用中断方式调用系统功能一样，用API方式调用存放在DLL中的函数必须同样约定一个规范，用来定义函数的调用方法、参数的传递方法和参数的定义，洋洋洒洒几百MB的Windows系统比起才几百KB规模的DOS，其系统函数的规模和复杂程度都上了一个数量级，所以在使用一个API时，带的参数数量多达十几个是常有的事，在DOS下用寄存器来传递参数的方法显然已经不能胜任了。

Win32　API是用堆栈来传递参数的，调用者把参数一个个压入堆栈，DLL中的函数程序再从堆栈中取出参数处理，并在返回之前将堆栈中已经无用的参数丢弃。在Microsoft发布的《Microsoft　Win32　Programmer's　Reference》中定义了常用API的参数和函数声明，先来看消息框函数的声明：

int　MessageBox（

　　　　HWND　hWnd；　　　　　　　　　　//　handle　to　owner　window

　　　　LPCTSTR　lpText；　　　　　//　text　in　message　box

　　　　LPCTSTR　lpCaption；　　//　message　box　title

　　　　UINT　uType　　　　　　　　　　//　message　box　style

　　　　）；

最后还有一句说明：

Library：　Use　User32。lib。

上述函数声明说明了MessageBox有4个参数，它们分别是HWND类型的窗口句柄（hWnd），LPCTSTR类型的要显示的字符串地址（lpText）和标题字符串地址（lpCaption），还有UINT类型的消息框类型（uType）。这些数据类型看起来很复杂，但有一点是很重要的，对于汇编语言来说，Win32环境中的参数实际上只有一种类型，那就是一个32位的整数，所有这些HWND，LPCTSTR和UINT实际上就是汇编中的dword（double　word），之所以定义为不同的模样，是用来说明用途。由于Windows是用C写成的，世界上的程序员好像也是用C语言的最多，所以Windows所有编程资料发布的格式也是C格式。

上面的声明用汇编的格式来表达就是：

MessageBox　Proto　hWnd：dword；lpText：dword；lpCaption：dword；uType：dword

上面最后一句Library：　Use　User32。lib则说明了这个函数包括在User32。dll中。

有了函数原型的定义以后，就是调用的问题了，Win32　API调用中要把参数放入堆栈，顺序是最后一个参数最先进栈，在汇编中调用MessageBox函数的方法是：

push　　　　uType

push　　　　lpCaption

push　　　　lpText

push　　　　hWnd

call　　　　MessageBox

在源程序编译链接成可执行文件后，call　MessageBox语句中的MessageBox会被换成一个地址，指向可执行文件中的导入表，导入表中指向MessageBox函数的实际地址会在程序装入内存的时候，根据User32。dll在内存中的位置由Windows系统动态填入。

1。　使用invoke语句

API是可以调用了，另一个烦人的问题又出现了，Win32的API动辄就是十几个参数，整个源程序一眼看上去基本上都是把参数压入堆栈的push指令，参数的个数和顺序很容易搞错，由此引起的莫名其妙的错误源源不断，源程序的可读性看上去也很差。如果写的时候少写了一句push指令，程序在编译和链接的时候都不会报错，但在执行的时候必定会崩溃，原因是堆栈对不齐了。

有没有解决的办法呢？最好是像C语言一样，能在同一句中打入所有的参数，并在参数使用错误的时候能够提示。

好消息又来了，Microsoft终于做了一件好事，在MASM中提供了一个伪指令实现了这个功能，那就是invoke伪指令，它的格式是：

　　　　invoke　　函数名＇，参数1＇＇，参数2＇……

对MessageBox的调用在MASM中可以写成：

invoke　　MessageBox；NULL；offset　szText；offset　szCaption；MB_OK

注意，invoke并不是80386处理器的指令，而是一个MASM编译器的伪指令，在编译的时候它把上面的指令展开成我们需要的4个push指令和1个call指令，同时，进行参数数量的检查工作，如果带的参数数量和声明时的数量不符，编译器会报错：

error　A2137：　too　few　arguments　to　INVOKE

编译时看到这样的错误报告，首先要检查的是有没有少写了一个参数。对于不带参数的API调用，invoke伪指令的参数检查功能可有可无，所以既可以用call　API_Name这样的语法也可以用invoke　API_Name这样的语法。

2。　API函数的返回值

有的API函数有返回值，如MessageBox定义的返回值是int类型的数，返回值的类型对汇编程序来说也只有dword一种类型，它永远放在eax中。如果要返回的内容不是一个eax所能容纳的，Win32　API采用的方法一般是返回一个指针，或者在调用参数中提供一个缓冲区地址，干脆把数据直接返回到缓冲区中去。

　
来源：电子工业出版社　作者：罗云彬　上一页　　　　　　　　　回书目　　　　　　　　　下一页　　　　　　　　　　
上一页　　　　　　　　　回书目　　　　　　　　　下一页　　　　　　　　　　
　　

第3章　使用MASM

3。2　调用API（2）

　　　　
3。　函数的声明

在调用API函数的时候，函数原型也必须预先声明，否则，编译器会不认这个函数。invoke伪指令也无法检查参数个数。声明函数的格式是：

函数名　proto　＇距离＇　＇语言＇　＇参数1＇：数据类型，＇参数2＇：数据类型，……

句中的proto是函数声明的伪指令，距离可以是NEAR，FAR，NEAR16，NEAR32，FAR16或FAR32，Win32中只有一个平坦的段，无所

返回目录上一页下一页回到顶部赞（2）踩（2）

第2章

windows环境下32位汇编语言程序设计-第2章

你可能喜欢的