初探机器学习：从 10 行代码开始的征程

2024-01-05 14:33:57

从入门到精通：10 行代码入门机器学习

在数字化的时代浪潮中，机器学习（ML）已成为一股不可忽视的力量。它赋予计算机从数据中学习和做出决策的能力，从而在各行各业引发变革。

对于初学者而言，机器学习的复杂性可能让人望而生畏。但是，通过分解它背后的基本原理，即使是新手也可以迈出第一步。本文将带你踏上机器学习之旅，仅需 10 行 Python 代码。

10 行代码解析

首先，让我们来看看这 10 行代码：

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# 1. 加载数据
data = pd.read_csv('data.csv')

# 2. 准备数据
X = data[['feature1', 'feature2']]  # 特征
y = data['target']  # 标签

# 3. 分割数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 4. 创建模型
model = LinearRegression()

# 5. 训练模型
model.fit(X_train, y_train)

# 6. 评估模型
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

# 7. 打印评估结果
print('MSE:', mse)
print('R2:', r2)

# 8. 保存模型
import pickle
pickle.dump(model, 'model.pkl')

# 9. 加载模型
loaded_model = pickle.load('model.pkl')

# 10. 使用模型进行预测
new_data = pd.DataFrame([[1, 2]])
prediction = loaded_model.predict(new_data)

print('预测：', prediction)