程序员的入门知识：C 源代码是如何运行的？

2024-02-27 22:27:23

作为一名程序员，C 语言想必大家都不会陌生。还记得当年在黑窗口中第一次显示出 "hello, world!" 时激动的心情吗？平时在编写 C 程序时，我们都会借助集成开发环境 (IDE)，在写好源代码之后，只需单击一个按钮，即可一键运行。但不同的 IDE 会有不同的按钮，甚至还有多个按钮，如先单击编译按钮，然后再单击运行按钮。那么，C 源代码究竟是如何运行的呢？本文将从头开始，一步一步地揭开 C 源代码运行的秘密，帮助你深入理解计算机底层的工作原理。

编译：从源代码到汇编代码

C 源代码只是一个文本文件，包含了程序员用 C 语言编写的指令。为了让计算机能够理解这些指令，需要将其转换为计算机可以识别的二进制语言。这个转换过程由编译器来完成。

编译器是一个程序，它将 C 源代码翻译成汇编代码。汇编代码是一种低级语言，它比 C 源代码更接近计算机的底层指令集。汇编代码中包含了许多与计算机体系结构相关的指令，如加载寄存器、存储内存等。

汇编：从汇编代码到机器代码

汇编代码虽然比 C 源代码更接近计算机底层指令集，但它仍然不是计算机可以直接执行的指令。还需要一个名为汇编器的程序将汇编代码转换为机器代码。

机器代码是一种计算机可以理解和直接执行的二进制指令。每条机器代码指令都对应于计算机的一个基本操作，如加法、减法、存储等。

链接：从多个目标文件到可执行文件

在编译和汇编阶段，源代码被翻译成多个目标文件，每个目标文件包含了一个函数或一组函数的机器代码。为了将这些目标文件组合成一个可执行文件，需要一个称为链接器的程序。

链接器将多个目标文件链接在一起，并解析符号引用和外部函数调用。符号引用是指对其他目标文件中定义的变量或函数的引用，外部函数调用是指对外部库中定义的函数的调用。

操作系统：加载和执行可执行文件

链接完成后，就生成了一个可执行文件。操作系统负责将可执行文件加载到内存中并执行它。

操作系统将可执行文件加载到内存中的一个称为进程的区域中。进程包含了程序的代码、数据和堆栈。堆栈是一个用于存储函数调用信息和局部变量的内存区域。