本文利用C语言介绍源文件是如何一步一步地编译、链接成为可执行程序的。
编译链接本身分为许多个过程,但从整体上可以概括为以下三点:
【资料图】
分别
通过编译器的编译,生成对应的目标文件。每个目标文件通过链接器链接在一起,形成一个独立单一而完整
的可执行文件。链接时会在链接库内搜索C标准库及程序员个人函数库
中的函数,并将其链接至可执行程序。整体过程如下图所示:
预处理,又叫预编译,源文件在进入编译器后要首先进行预处理操作,告诉编译器如何预处理的代码被称为预处理指令,常见的有头文件的包含,宏定义等。
经过预处理后的文件后缀会变为i
,文件以i
为后缀代表其已经过预处理,但未进行下一阶段的编译。
在我们写代码时,包含头文件的是必不可少的,而在预处理中:包含头文件的操作等同于拷贝头文件中的代码,随后将源文件中的代码和头文件中的代码一起放入后缀为i
的文件中。
预处理前:
预处理后:
相当于将头文件中的代码拷贝至源文件的头部,同时删掉#include"head.h"
其效果与下面的代码相同,此时的文件后缀为i
。
struct MyStruct{int a;int b;};int main(){struct MyStruct s;return 0;}
在预处理时,源文件中宏定义内容会在i
文件中被直接替换。
预处理前:
#include#define MAX 100int main(){int a = MAX;printf("%d\n", a);return 0;}
预处理后:
预处理后MAX
会被直接替换为100
,同时删除前面的#define MAX 100
,其效果与下图代码相同。
在预处理时,编译器还会删除//
后面的内容以及被/* */
包括起来的内容,以便于接下来的编译阶段。
如图:
可以看到,不管是头文件、宏定义、还是注释,都是编译器对文本
的操作。
因此可以说:预处理阶段是编译器对文本的操作阶段。
当源文件经过预处理后,便开始第二个阶段——编译,经过编译的文件的后缀将变成s
,文件后缀为s
代表其已经经过第二阶段的编译,但未进行汇编操作。
编译阶段会将C语言代码进行语法分析
、词法分析
、词义分析
,以及符号汇总
。
编译阶段从整体上看是对C语言代码进行分析解读
由于该阶段涉及编译的原理,因此只了解大概即可,详见书籍《编译原理》。
当源文件经过第一、二阶段后,便开始第三个阶段——汇编,经过汇编的文件的后缀将变成o或obj
,即开头所说的目标文件
,文件后缀为o或obj
代表其至少已经经过三个阶段的编译。
PS:在VS环境下生成的目标文件后缀为obj
,在GCC环境下生成的目标文件后缀为o
。
在第二阶段的编译中会将代码中的全局变量
,函数名
等汇总,并在汇编阶段形成类似一张表格。
收集以下代码中的全局变量与函数名:
形成表格:
符号表的详细作用在链接时详细介绍。
名 | 址 | ... |
---|---|---|
val | 0X0012FF40 | |
add | 0X0012FF80 | |
main | 0X0012FF20 |
链接主要包括合并段表
、符号表的合并及重定位
两大过程。
下面依次介绍。
在源文件经过编译过程后文件后缀变为o
或obj
后,其内部的代码已经变成二进制。
此时,文件会将内部的二进制代码按类型
划分成许多部分,每一部分就被称为一段。
如图:
前文我们说到,多个目标文件经过链接器后整合为一个独立而完整的文件,因此链接中合并段表的意思就是把多个目标文件中对应的段,合并在一个目标文件内。
顾名思义,将每个目标文件中的符号表合并成一个目标文件的符号表。
如果在写代码时发生函数定、声明、使用等不在同一源文件等情况,那么多个目标文件的符号表中可能都会有相同的函数名及无效的地址,像这样:
如上图,在两个文件中都有add的存在,那么,在head.obj
和源.obj
的符号表中都会有收录add。
但因源.c
中没有对add进行实现,因此在汇总源.c
的符号表时,其地址会被填入一个无效的地址。
在链接过程中,链接器不仅会对符号表合并,也会将多余的符号删除,同时将每个符号的地址都定位为所有地址中有效的那一个。
如果在写代码时不小心将函数名写错了,像这样:
那么由于在head.h
汇总符号表时找不到代码实现,就会把Add
的地址赋为一个无效的地址,像这样:
名 | 址 |
---|---|
Add | 0X00000000 |
add | 0X0012FF40 |
但是,在符号表的重定位时,也没有重定位Add的有效地址,那么链接就无法完成,就会报出典型的错误:
PS:函数声明extern
的作用就是告诉编译器,遇到无法解释的符号先别急着报错,后面会有定义的。
多个源文件经过预处理(头文件包含、宏定义替换、注释的删除),编译(语法分析、词法分析、词义分析、符号汇总),汇编(二进制指令翻译、形成符号表)后成为一个目标文件。
多个目标文件在链接库的帮助下完成合并段表,符号表合并,符号表重定位后整合为一个目标文件。
到最后变成一个可执行的exe文件。
感谢您的阅读与耐心~
预处理,又叫预编译,源文件在进入编译器后要首先进行预处理操作,...
通润装备(002150)02月13日在投资者关系平台上答复了投资者关心的问题。
12日,一则“南宁房贷年龄期限可延长至80岁”的新闻冲上热搜榜。 ...
Pinbar交易策略的6种类型,交易,信号,示例,长尾,pin,条形图
送礼物给男生送什么比较好(送这些给礼物比较好)我的想法有很多可不...
众所周知,三星手机在全球市场拥有很高的市场份额,可以算是全球最...
1、客厅茶几放上水石旺家。2、上水石是用来装饰假山的,所以摆放上...
2022款斯巴鲁WRXSTIPerformance已经在下个月作为概念车在东京汽车沙...
1、谷歌搜索--上海市职业能力考试院。2、第一个就是。本文就为大家...
1、飞人2、飞机3、飞行员4、飞鸟5、飞行6、飞船7、起飞8、飞速9、飞...
1、韩红1971年出生于西藏自治区昌都市,祖籍山东德州,现年49岁。另...
北京时间2月9日凌晨3点整,2023年世俱杯半决赛展开角逐,皇家马德里...
万能的作文开头集锦1、毅力,是千里大堤一沙一石的凝聚,一点点地累...
鸡汤营养丰富又美味,许多家庭把鸡汤当作滋补的佳品,同时家中有病...
1、502胶是以α-氰基丙烯酸乙酯为主,加入增粘剂、稳定剂、增韧剂...
1、力尽筋疲终不悔是牛生肖,指的是十二生肖之一的牛。2、牛在十二...
必备军训日记6篇一天的生活不知不觉间结束了,这一天里,有没有哪件...
2023年2月8日,佳能1(中国)有限公司正式发布一款普及型全画幅专微...
8日至9日,中东部地区将出现大范围雨雪天气过程,江汉、江淮、江南...
1、安史之乱是指中国唐代玄宗末年至代宗初年由唐朝将领安禄山与史思...
流年忆思优美散文看昨天的我们走远了在命运广场中央等待那模糊的肩...
作为支撑新型电力系统的重要技术和基础装备,储能产业驶入发展快车...
1、吕树:小说里的男主角,擅长怼人、噎人、气人,但是从不骂人。从...
夏季的到来,女性穿着打扮十分暴露,这刚好被变态色狼盯上,成为了...
1、IMO编号即IMONumber是指国际海事组织的识别码,是船舶名称代码。2...
当下教育都是每个家庭中非常重要一个环节,因为很多家庭为了让孩子...
1、第一步:创建一个世界第二步:一定要换创造模式。2、否则等下到...
野火烧不尽打一成语,风吹草生。解释:要想到野火烧不尽的下一句诗...
百家淘客(08287)发布公告,公司一直难以联络和控制集团主要附属公司...
深林深处的异种(进化前)精灵职业植物族类型进化费用1:这个随从进...