音视频开发之旅（58）——H.264帧内预测漫谈

Android

2023-12-04 09:50:38

H.264 帧内预测：图像压缩中的像素预测

在视频压缩领域，H.264 是一种广泛使用的视频编码标准。帧内预测是 H.264 编码器中至关重要的一步，它利用图像中的空间相关性来预测像素值，从而提高压缩效率。本文将深入探讨 H.264 帧内预测的原理、方法和实施。

什么是帧内预测？

帧内预测是一种图像压缩技术，它利用图像中相邻像素之间的相关性来预测当前像素的值。通过预测像素值，编码器可以避免直接编码原始像素，从而减少数据冗余和提高压缩率。

H.264 中的帧内预测

H.264 帧内预测算法将图像分解为宏块，每个宏块由 16x16 个像素组成。对于每个宏块，编码器会评估一组预测模式，并选择最能匹配宏块像素分布的模式。根据宏块大小，H.264 定义了以下预测模式：

4x4 亮度块： 9 种模式
16x16 亮度块： 4 种模式
8x8 色度块： 4 种模式

预测模式

4x4 亮度块的 9 种预测模式如下：

VERTICAL_LEFT：从左上方、左中和左下方像素预测
VERTICAL_RIGHT：从右上方、右中和右下方像素预测
HORIZONTAL_UP：从上方中、右上和左上像素预测
HORIZONTAL_DOWN：从下方中、右下和左下像素预测
DC：从相邻 4 个宏块的平均值预测
DIAGONAL_DOWN_LEFT：从左上方、中上和左中像素预测
DIAGONAL_DOWN_RIGHT：从右上方、中上和右中像素预测
VERTICAL_UP：从上左、中上和上右像素预测
VERTICAL_DOWN：从下左、中下和下右像素预测

对于 16x16 亮度块和 8x8 色度块，预测模式则分别为 4 种和 3 种。

帧内预测实施

在 JM（Joint Model）参考软件中，帧内预测函数 Intra4x4Prediction() 根据预测模式对 4x4 亮度块进行预测。以下是该函数的简要概述：

void Intra4x4Prediction(uint8_t* srcY, int width, int block_x, int block_y, uint8_t* dstY) {
  int pred_mode = GetIntra4x4PredMode(block_x, block_y, width, height);
  switch (pred_mode) {
    case VERTICAL_LEFT:
      VerticalLeftPrediction(srcY, width, block_x, block_y, dstY);
      break;
    case VERTICAL_RIGHT:
      VerticalRightPrediction(srcY, width, block_x, block_y, dstY);
      break;
    // ...省略其他模式的实现
    default:
      break;
  }
}