首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

C+程序编译之谜(三)——简单还是复杂?编译到底有哪些步骤?

通常我们用IDE写完一个程序后,点击编译按钮的时候,内部到底发生了什么?为什么会生成一个可执行文件?这个过程到底有哪些步骤呢?是很简单还是很复杂呢?这篇文章,我们把这些事情讲清楚。

首先要明确一点,编译只是一个统称,编译的整个过程有预处理、编译、汇编和链接的过程

我们给出一个特别简单的程序

1、预处理

预处理阶段的指令一般都是以#来开头的,替换#include包含的头文件,替换#define定义的宏,删除注释,去掉#ifdef不符合条件的那一部分,所有#开头的代码都会在预处理阶段完成处理。

预处理命令:gcc -E test.c -o test.i

这里-E的作用是让程序在预处理完成之后就停止,为了方便我们后面的观察。我们在当前目录下ls,就可以看见多了一个test.i的文件,打开它可以看到很多变量、函数等等的声明,这些都是stdio.h这个头文件展开的结果,拉到最后,可以看到我们定义的宏max被替换成5了。

2、编译

大学如果学的是计算机专业的童鞋一定会学过一门《编译原理》的课,这门课几乎会把很多大学生折腾得死去活来。而这个编译的过程也正式编译原理里面介绍的内容,包括词法分析、语法分析、语义分析、程序优化等等一系列的过程,这些都是编译器的核心内容,如果你想开发编译器,这个过程你要非常非常的精通!这个过程就是把程序编译成更接近机器语言的汇编语言。平时我们用IDE编译的时候,经常看见的错误和警告,一般都是在过程发出的。

编译命令:gcc -S test.i -o test.s

这里-S的作用是让程序在编译完成之后就停止,为了方便我们后面的观察。我们在当前目录下ls,就可以看见多了一个test.s的文件,打开它看到的一大堆汇编指令。这些指令,我根本看不懂,说实话,没有接触过汇编语言的人,几乎都是看不懂的。但是如果你是想在编译器这个底层领域翻江倒海的话,汇编语言是必须要懂的。

3、汇编

汇编语言有些专业人员看得懂,但是计算机是根本就看不懂的。计算机看得懂的仅仅只有010101这种机器语言,所以我们还要将汇编语言转换成机器语言,至于这个过程怎么转的,不在本文的讨论范围,也讨论不了,因为我也不知道。这些都是那些非常厉害的大神的研究领域,真不是我夸大这个难度,能开发出商用编译器的人,至少在计算机领域绝对都是逆天的天选之子。

汇编命令:gcc -C test.i -o test.o

我们在当前目录下ls,就可以看见多了一个test.o的文件,打开它看到的一大堆乱码,实际上这些都是二进制命令,而这些命令才是计算机能看得懂的。

4、链接

二进制文件虽然计算机可以看懂了,但是如果你的源文件中用到了其他自己写的头文件的函数,或者是第三方静态库动态库,这时候还需要进行把它们链接起来生成可执行文件,才可以正确的被执行。

链接命令:gcc test.o -o test

但是如果引用的头文件是C/C++语言级别自带的话,换种说法就是,只有一个源文件,貌似不需要进行链接这一步,直接运行上面编译生成的.o文件也可以。反而进行链接操作的话会报这个错误,原因我暂时也没找到,如果知道的朋友欢迎留言评论。

/opt/rh/devtoolset-9/root/usr/libexec/gcc/x86_64-redhat-linux/9/ld: error in test.o(.eh_frame); no .eh_frame_hdr table will be created

以上就是编译的几个步骤,只有比较清晰地掌握好每个步骤,才能真正地把编译的整个流程搞清楚。当然,你也可以用一步到位的方式进行编译:

gcc test.c -o test

这样可以直接生成可执行文件。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210214A04QQA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com