从0到1，构建你的首个多层神经网络

人工智能

2023-11-05 17:11:11

揭开多层神经网络的神秘面纱：实现你的第一个神经网络

概述

踏入人工智能的迷人领域，让我们深入探索多层神经网络的复杂世界。这些强大的网络在计算机视觉、自然语言处理和语音识别等领域取得了惊人的进步。本文将深入浅出地阐述多层神经网络的概念，并指导你构建你自己的第一个网络。

多层神经网络：分层学习

想象一个由多层相互连接的神经元组成的网络。每层的神经元接收前一层的输出，并通过连接权重将其处理后的结果传递给下一层。这种分层结构赋予了神经网络处理复杂数据的非凡能力。

多层感知机：入门级神经网络

多层感知机（MLP）是一种流行的前馈神经网络，具有简单但有效的架构。每一层神经元与下一层完全连接，形成一个多层的层级结构。MLP擅长解决各种分类和回归问题。

构建你的第一个神经网络

构建一个多层神经网络涉及以下步骤：

定义网络结构： 确定神经元数量和连接方式。
初始化权重： 为网络的连接分配随机权重。
前向传播： 逐层计算神经元的输出。
计算误差： 比较输出与期望值，计算误差。
反向传播： 反向传播误差，计算权重的梯度。
更新权重： 根据梯度调整权重。

示例代码：用 Python 构建 MLP

以下 Python 代码展示了一个简单的 MLP 的实现：

import numpy as np

class MLP:
    # 初始化神经网络
    def __init__(self, layers):
        self.weights = [np.random.randn(l1, l2) for l1, l2 in zip(layers[:-1], layers[1:])]
        self.biases = [np.zeros((l,)) for l in layers[1:]]

    # 前向传播
    def forward(self, x):
        for w, b in zip(self.weights, self.biases):
            x = np.dot(x, w) + b
            x = np.maximum(0, x)  # ReLU 激活函数
        return x

    # 反向传播
    def backward(self, x, y):
        nabla_w = [np.zeros_like(w) for w in self.weights]
        nabla_b = [np.zeros_like(b) for b in self.biases]
        delta = x - y
        for i in range(len(self.layers) - 2, -1, -1):
            delta = np.dot(delta, self.weights[i].T) * (x > 0)
            nabla_w[i] = np.dot(x.T, delta)
            nabla_b[i] = np.sum(delta, axis=0)
            x = self.forward(x)
        return nabla_w, nabla_b

    # 更新权重
    def update(self, nabla_w, nabla_b, lr):
        self.weights = [w - lr * nw for w, nw in zip(self.weights, nabla_w)]
        self.biases = [b - lr * nb for b, nb in zip(self.biases, nabla_b)]

    # 训练神经网络
    def train(self, X, Y, epochs=100, lr=0.01):
        for _ in range(epochs):
            for x, y in zip(X, Y):
                nabla_w, nabla_b = self.backward(x, y)
                self.update(nabla_w, nabla_b, lr)

    # 预测
    def predict(self, X):
        return np.argmax(self.forward(X), axis=1)