简单易懂的标准与局部加权线性回归原理及Python实现

2023-10-18 21:44:21








**标准线性回归** 

标准线性回归，也称普通最小二乘法（OLS），是回归分析中最基本的方法。它的核心思想是寻找一条直线，使得这条直线与所有数据的距离之和最小。距离的度量通常采用欧几里得距离，因此标准线性回归也称为最小二乘法。

**局部加权线性回归** 

局部加权线性回归（LWR）是一种非参数回归方法。它通过为每个数据点赋予不同的权重来估计回归函数。权重的计算方法通常基于数据点与目标点的距离，距离越近的点权重越大。这样，在估计回归函数时，距离目标点较近的点的贡献较大，而距离目标点较远的点的贡献较小。

**Python实现** 

我们可以使用Scikit-Learn库来轻松实现标准线性回归和局部加权线性回归。

```python
from sklearn.linear_model import LinearRegression, LocalPolynomialRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# 加载数据
data = ...

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(data.drop('target', axis=1), data['target'], test_size=0.2)

# 训练标准线性回归模型
lr = LinearRegression()
lr.fit(X_train, y_train)

# 训练局部加权线性回归模型
lwr = LocalPolynomialRegression(kernel='tricube', degree=2, n_jobs=-1)
lwr.fit(X_train, y_train)

# 预测测试集
y_pred_lr = lr.predict(X_test)
y_pred_lwr = lwr.predict(X_test)

# 评估模型性能
mse_lr = mean_squared_error(y_test, y_pred_lr)
mse_lwr = mean_squared_error(y_test, y_pred_lwr)

print('标准线性回归的均方误差：', mse_lr)
print('局部加权线性回归的均方误差：', mse_lwr)