如何从音频信号中提取每个音效持续时间范围内的包络曲线？

python

2024-03-06 02:35:35

提取每个音效持续时间范围内的包络曲线

简介

在音频信号分析中，包络曲线扮演着至关重要的角色。它了信号强度的变化，提供有关声音事件和动态变化的宝贵见解。本文探讨如何从音频信号中提取每个音效持续时间范围内的包络曲线。

算法方法

获取包络曲线的算法涉及以下步骤：

信号分帧： 将信号分解为帧，每个帧由指定的样本组成。
计算帧幅度： 确定每个帧内的最大振幅。
构建包络曲线： 将每个帧的振幅添加到包络数组中。
提取时间范围： 识别音效持续时间范围，并提取相应包络值。

代码实现

我们提供经过修改的代码片段，用于提取特定时间范围内的包络曲线：

import librosa
import numpy as np
import matplotlib.pyplot as plt

# 加载音频文件
audio_file = "audio.wav"
audio, sr = librosa.load(audio_file)

# 帧大小和步长
FRAME_SIZE = 1024
HOP_LENGTH = 512

# 计算包络曲线
def amplitude_envelope(signal, frame_size, hop_length):
    amplitude_envelope = []
    for i in range(0, len(signal), hop_length):
        amplitude_envelope.append(max(signal[i:i+frame_size]))
    return np.array(amplitude_envelope)

# 提取音效持续时间范围
sound_durations = [0.79, 0.21, 0.9]  # 以秒为单位

# 获取每个音效持续时间范围内的包络值
ae_durations = []
for duration in sound_durations:
    start_frame = int(duration * sr / HOP_LENGTH)
    end_frame = start_frame + int((duration + HOP_LENGTH / sr) * sr / HOP_LENGTH)
    ae_duration = amplitude_envelope(audio, FRAME_SIZE, HOP_LENGTH)[start_frame:end_frame]
    ae_durations.append(ae_duration)

# 可视化结果
plt.figure(figsize=(15, 5))
for i, ae_duration in enumerate(ae_durations):
    plt.subplot(len(ae_durations), 1, i+1)
    plt.plot(ae_duration)
    plt.title(f"Sound Event {i+1}")

plt.tight_layout()
plt.show()