LeetCode 486：预测赢家——动态规划算法剖析

人工智能

2024-01-23 20:49:54

引言

算法竞赛中，LeetCode 486 的预测赢家问题以其巧妙的设计吸引了众多求解者。该问题旨在检验解决取数决策问题的动态规划算法技能。本文将带领大家深入剖析这一算法，从问题定义到 Python 代码实现，提供全面而深入的解答。

问题定义

预测赢家问题如下：

给定一个整数数组 nums，其中 nums[i] 表示第 i 个堆叠的石子数目。玩家轮流从数组的两端移除石子，每次移除 1 或更多个石子。移除石子最多的玩家获胜。

假设玩家遵循最优策略，预测玩家是否可以赢得这场比赛。

动态规划算法

动态规划算法是一种解决最优化问题的有力工具，尤其适用于具有重叠子问题和最优子结构性质的问题。预测赢家问题正是这类问题的一个典型代表。

算法设计

状态定义： 设 dp[i][j] 表示玩家从数组下标 i 到下标 j 取石子时的最大获胜优势。其中，dp[i][j] > 0 表示先手玩家在子区间 [i, j] 上的获胜优势，dp[i][j] < 0 表示后手玩家的获胜优势，dp[i][j] = 0 表示两人优势相等。
状态转移方程：
- 当 i == j 时，dp[i][j] = nums[i]，即玩家只能取当前堆叠的石子。
- 当 i < j 时，dp[i][j] = max(nums[i] - dp[i+1][j], nums[j] - dp[i][j-1])。这表示先手玩家在子区间 [i, j] 上的最佳策略是取走 nums[i] 或 nums[j] 中的一个，使其获得的最大优势。
边界条件：
- dp[i][i] = nums[i]
- dp[i][j] = 0，对于 i > j

Python 代码实现

def PredictTheWinner(nums):
  """
  :type nums: List[int]
  :rtype: bool
  """

  n = len(nums)
  dp = [[0] * n for _ in range(n)]

  for i in range(n-1,-1,-1):
    dp[i][i] = nums[i]

  for j in range(1, n):
    for i in range(n-j):
      dp[i][i+j] = max(nums[i] - dp[i+1][i+j], nums[i+j] - dp[i][i+j-1])

  return dp[0][n-1] >= 0