编译原理复习：语法分析（四）

见解分享

2023-12-18 19:58:06

自顶向下LL(1)语法分析：剖析源程序的语法树

语法分析：编程语言解析的基石

在编程的世界中，语法分析就像一块基石，支撑着编译器从源代码构建程序的复杂过程。它负责检查源代码是否符合语言的语法规则，确保其结构正确且可执行。自顶向下LL(1)分析是一种常用的语法分析方法，以其高效性和准确性而著称。

LL(1)语法：预测未来

LL(1)语法是一个语法类别，它的独特之处在于它可以通过查看下一个输入符号（称为lookahead）来确定下一个动作。也就是说，它能够预测程序的未来，从而避免盲目地逐字逐句地解析代码。

要满足LL(1)语法，必须满足两个关键条件：

无左递归： 文法中不能出现A -> Aa形式的左递归产生式。
预测集不重叠： 对于每个非终结符，它的预测集（可以推导出它的字符串开头）不能与其他非终结符的预测集重叠。

First集和Follow集：预测的基石

First集和Follow集是LL(1)分析的基础。First集包含一个非终结符可以推导出的所有字符串的开头符号，而Follow集包含它可以出现在其后的符号。通过计算这些集合，我们可以了解非终结符的行为并预测它们在输入中的出现。

预测分析表：动作指南

预测分析表是语法分析的舵手，它告诉分析器在特定符号组合下应该采取什么行动。它是根据First集和Follow集构建的，行由非终结符构成，列由终结符构成。当栈顶符号是某个非终结符且输入符号是某个终结符时，该表指示分析器执行相应的产生式。

语法分析过程：一步步拆解代码

使用LL(1)分析，语法分析过程就像一层一层剥开洋葱。它从开始符号出发，逐步推导出源代码的语法树，表示程序的层级结构。根据预测分析表，分析器确定每个步骤中的产生式，并相应地更新栈和输入。

实例：深入剖析

让我们考虑一个简单的文法：

E -> TE'
E' -> +TE' | ε
T -> FT'
T' -> *FT' | ε
F -> (E) | id

其中，ε表示空串。

First集：

First(E) = {id, (}
First(E') = {+, ε}
First(T) = {id, (}
First(T') = {*, ε}
First(F) = {id, (}

Follow集：

Follow(E) = {)}
Follow(E') = {)}
Follow(T) = {+, ), }
Follow(T') = {+, ), }
Follow(F) = {+, ), }

预测分析表：

     id   (   )   +
E    F    E    F   E'
E'   +T  ε    ε   ε
T    F    F    F   ε
T'   *T  ε    ε   ε
F    id   (   ε   ε

语法分析过程：

假设输入字符串为：id + id * id

栈            输入            动作
$ E            id + id * id    shift(E)
E F            id + id * id    shift(F)
F id           id + id * id    reduce(F -> id)
F T            id + id * id    shift(T)
T F            id + id * id    shift(F)
F id           id + id * id    reduce(F -> id)
T T            id + id * id    shift(T')
T' *            id + id * id    shift(*)
F id           id + id * id    shift(F)
F id           id + id * id    reduce(F -> id)
T T'           id + id * id    reduce(T -> FT')
E' +            id + id * id    shift(+)
T F            id + id * id    shift(F)
F id           id + id * id    reduce(F -> id)
T T'           id + id * id    reduce(T -> FT')
E' E            id + id * id    reduce(E' -> +TE')
E E'           id + id * id    reduce(E -> TE')
$              id + id * id    accept