“再也不扩大规模！”——LeCun直言：GPT-4推理能力有限，推荐阅读两篇论文

人工智能

2023-11-30 05:22:21

自动回归语言模型：它们在推理中的局限性

自动回归语言模型（AR-LLM）正在引发人工智能领域的热潮，但最近的研究发现，它们在逻辑推理方面存在重大缺陷。在这篇博文中，我们将探讨AR-LLM推理能力的局限性，了解其背后的原因，并探索可能的解决方案。

AR-LLM的推理局限性

尽管AR-LLM在文本生成方面表现出色，但它们在语义推理方面却难以胜任。世界著名人工智能专家Yann LeCun的研究表明，AR-LLM难以：

理解语义蕴涵关系（例如，知道“所有男人都是凡人”意味着“张三是凡人”）
进行逆向推理（例如，从“张三是凡人”中推导出“张三是男人”）
处理否定句（例如，“张三不是男人”）

局限性的根源

为什么AR-LLM在推理方面如此受限？LeCun认为，这是因为它们主要通过庞大且嘈杂的文本数据集进行训练。虽然这些数据集包含大量的语言知识，但它们往往是碎片化、不完整甚至错误的。因此，AR-LLM难以学习可靠的推理规则。

解决推理缺陷

解决AR-LLM推理缺陷的潜在方法包括：

使用更干净的数据 ：过滤掉有缺陷和不完整的数据，并引入人类专家来验证其准确性。
采用更好的训练方法 ：探索能够更好地学习语义蕴涵、逆向推理和否定句的训练算法。
构建更大的模型 ：虽然这可能会暂时提高推理能力，但它不是一个可持续的解决方案。

代码示例

为了说明AR-LLM的推理局限性，考虑以下代码：

import transformers

model = transformers.AutoModelForCausalLM.from_pretrained("gpt-2")

# 正确的前提
premise1 = "所有男人都是凡人。"
# 错误的前提
premise2 = "一些男人是凡人。"

# 将前提传递给AR-LLM
output1 = model.generate(transformers.InputFeatures(input_ids=[premise1]))
output2 = model.generate(transformers.InputFeatures(input_ids=[premise2]))

# 检查推理
print(output1[0].decode("utf-8"))  # 输出："张三是凡人。"（正确推理）
print(output2[0].decode("utf-8"))  # 输出："张三不是凡人。"（错误推理）