强势出击：支持向量机揭秘，案例助力直观理解

2023-12-21 06:35:42

SVM 原理浅析

支持向量机本质上是一个二类分类器，旨在将两组数据清晰区分开来。其基本思想是：在特征空间中找到一个间隔最大的超平面，将两类数据成功分离。这个超平面被称为“最大间隔超平面”，而与它相交的数据点被称为“支持向量”。这些支持向量对模型的决策边界起着至关重要的作用。SVM 的优化目标便是寻找这个最大间隔超平面，即最大化超平面与两组数据的最小距离。

SVM 的 Python 实现

为了加深读者对 SVM 的理解，本文将提供一个直观的 Python 案例。我们将使用 scikit-learn 库来构建一个 SVM 模型，并通过它来对鸢尾花数据集进行分类。鸢尾花数据集包含 150 个鸢尾花的样本，分为三个类别：山鸢尾、变色鸢尾和弗吉尼亚鸢尾。每个样本都有四个特征：萼片长度、萼片宽度、花瓣长度和花瓣宽度。

以下是 Python 代码实现：

# 导入必要的库
import numpy as np
import pandas as pd
from sklearn.svm import SVC

# 加载鸢尾花数据集
iris = pd.read_csv('iris.csv')

# 提取特征和标签
X = iris.drop('species', axis=1)
y = iris['species']

# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 创建 SVM 模型
model = SVC()

# 训练模型
model.fit(X_train, y_train)

# 评估模型
score = model.score(X_test, y_test)

# 打印准确率
print('准确率：', score)