如何在实际操作中利用lex和yacc制作计算器？——编译原理实战（一）

2023-11-04 23:42:13

编译原理是研究编译器结构与设计原理的计算机科学分支。它是计算机专业的一门核心课程，也是软件工程的基础。

本系列文章将通过实战的方式，带你了解编译原理及其构成元素。我们将使用lex和yacc工具来构建一个计算器，从词法分析和语法分析开始，一步步深入编译原理的世界。

词法分析器

词法分析器是编译器的前端，负责将源代码中的字符序列分解成一系列称为“记号”的词法单元。例如，词法分析器会将“int main() {”分解成以下记号：

int
main
(
)
{

词法分析器通常使用正则表达式来识别记号。例如，以下正则表达式可以匹配C语言中的标识符：

[a-zA-Z_][a-zA-Z0-9_]*

语法分析器

语法分析器是编译器的后端，负责检查源代码的语法结构是否正确。语法分析器使用上下文无关文法（CFG）来源代码的语法结构。例如，以下CFG可以C语言中程序的语法结构：

<program> ::= <declaration-list> <statement-list>
<declaration-list> ::= <declaration> | <declaration-list> <declaration>
<declaration> ::= <type-specifier> <identifier> ;
<type-specifier> ::= int | float | char
<identifier> ::= [a-zA-Z_][a-zA-Z0-9_]*
<statement-list> ::= <statement> | <statement-list> <statement>
<statement> ::= <expression-statement> | <compound-statement> | <selection-statement> | <iteration-statement> | <return-statement>
<expression-statement> ::= <expression> ;
<compound-statement> ::= { <statement-list> }
<selection-statement> ::= if ( <expression> ) <statement> [else <statement>]
<iteration-statement> ::= while ( <expression> ) <statement> | for ( <expression> ; <expression> ; <expression> ) <statement>
<return-statement> ::= return <expression> ;
<expression> ::= <term> | <expression> <add-op> <term>
<term> ::= <factor> | <term> <mul-op> <factor>
<factor> ::= <identifier> | <constant> | ( <expression> )
<add-op> ::= + | -
<mul-op> ::= * | /
<constant> ::= <integer-constant> | <float-constant> | <character-constant>