利用 NumPy 在几行代码中编写神经网络

人工智能

2024-01-03 18:08:04

导言

神经网络正以惊人的速度改变着各个行业。从计算机视觉到自然语言处理，这些强大的机器学习模型正在推动创新的浪潮。虽然构建神经网络可能是一项复杂的任务，但借助 NumPy 这样的强大库，我们可以轻松地用几行代码创建一个。

NumPy 的强大功能

NumPy 是一个用于科学计算的 Python 库，它提供了一个多维数组对象以及各种用于处理这些数组的高级数学函数。通过利用 NumPy 的矩阵运算和广播功能，我们可以显著简化神经网络的实现。

神经网络的基本概念

神经网络是一种受人类大脑启发的机器学习模型。它们由被称为神经元的相互连接层组成，每个神经元接受输入、执行计算并产生输出。通过调整神经元之间的权重，神经网络可以学习从数据中提取模式和特征。

用 NumPy 构建神经网络

让我们逐步了解如何使用 NumPy 构建神经网络：

1. 定义神经元层

首先，我们需要定义网络的层。每一层都由一定数量的神经元组成，每个神经元都有自己的权重和偏差。我们可以使用 NumPy 数组来表示这些层：

# 定义输入层，有 2 个神经元
input_layer = np.array([[1, 2]])

# 定义隐藏层，有 3 个神经元
hidden_layer = np.array([[3, 4, 5]])

# 定义输出层，有 1 个神经元
output_layer = np.array([[6]])

2. 定义激活函数

激活函数用于对神经元的输出进行非线性变换。它们引入非线性，使网络能够学习复杂的关系。我们可以使用 NumPy 的数学函数来实现这些激活函数：

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def relu(x):
    return np.maximum(0, x)

3. 前向传播

前向传播是将输入通过网络的过程。对于每一层，我们计算每个神经元的加权和，然后应用激活函数：

# 前向传播
input_to_hidden = np.dot(input_layer, hidden_layer.T) + hidden_layer[-1]
hidden_to_output = np.dot(hidden_layer, output_layer.T) + output_layer[-1]

# 应用激活函数
hidden_output = relu(input_to_hidden)
output = sigmoid(hidden_to_output)

4. 反向传播

反向传播是调整网络权重以最小化损失函数的过程。我们可以使用链式法则来计算梯度并更新权重：

# 定义损失函数
def cross_entropy(y_pred, y_true):
    return -np.sum(y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred))

# 计算梯度
output_error = output - y_true
hidden_error = np.dot(output_error, output_layer)

# 更新权重
hidden_layer -= learning_rate * hidden_error
output_layer -= learning_rate * output_error

5. 训练网络

训练神经网络涉及重复前向传播和反向传播步骤，直到网络达到所需的准确性水平。我们可以使用 NumPy 的循环来实现训练过程：

# 训练网络
for epoch in range(num_epochs):
    # 前向传播
    # ...

    # 反向传播
    # ...

    # 输出损失
    if epoch % 10 == 0:
        print(f"Epoch {epoch}: Loss = {cross_entropy(output, y_true)}")