Python 中 is 和 == 的区别: 避免字符串比较的无限循环陷阱

2024-10-09 23:29:53

在 Python 的编程旅程中，我们经常需要对字符串进行比较，判断它们是否相等。你可能会想，这有什么难的？直接用等号 == 比较不就行了？的确，在很多情况下，== 可以很好地完成任务。但 Python 还提供了另一个比较运算符 is，它和 == 看起来很像，却有着微妙的不同。如果不了解它们之间的区别，就可能掉进一些陷阱，比如你遇到的那个恼人的无限循环。

问题的根源在于 is 和 == 运算符的工作原理不同。is 运算符比较的是两个变量的内存地址，换句话说，它检查这两个变量是否指向同一个对象。而 == 运算符比较的是两个变量的值，即使它们位于不同的内存地址，只要值相同，== 就会返回 True。

举个例子，假设我们有两个字符串变量 a 和 b，它们的值都是 "Python"：

a = "Python"
b = "Python"

如果我们用 is 运算符比较 a 和 b，结果会是什么呢？这取决于 Python 解释器的具体实现。有些解释器会对短字符串进行优化，把它们存储在同一个内存位置，这时 a is b 的结果就是 True。但有些解释器不会这样做，a 和 b 会被存储在不同的内存位置，即使它们的值相同，a is b 的结果也会是 False。

但如果我们用 == 运算符比较 a 和 b，结果就一定是 True，因为它们的值是相等的。

现在，让我们回到你遇到的无限循环问题。你使用了 while line is not '' 来控制循环的结束条件，你希望当 line 的值为空字符串时，循环终止。但是，因为 is 运算符的特殊性，line 可能并没有指向与空字符串字面量相同的内存地址，导致 line is not '' 的结果一直是 True，循环就停不下来了。

把 is not '' 改成 != '' 就可以解决这个问题，因为 != 运算符只比较值，不关心内存地址。

那么，在实际编程中，我们应该如何选择 is 和 == 呢？

通常情况下，我们应该优先使用 == 运算符来比较字符串，因为它更符合我们的直观理解，结果也更可靠。只有当我们需要判断两个变量是否指向同一个对象时，才应该使用 is 运算符，比如在检查一个变量是否为 None 时：