线性回归是机器学习中最基础的算法之一，用于建立输入变量（特征）与输出变量

百***3404

836人浏览 · 2026-01-11 01:17:24

百***3404 · 2026-01-11 01:17:24 发布

线性回归原理与代码实现

线性回归是机器学习中最基础的算法之一，用于建立输入变量（特征）与输出变量（目标）之间的线性关系。以下是其核心原理及Python实现。

数学原理

线性回归模型表示为：
$y = wX + b$
其中：

$y$ 是预测值
$X$ 是输入特征矩阵
$w$ 是权重（斜率）
$b$ 是偏置项（截距）

目标是最小化损失函数（均方误差）：
$L = \frac{1}{N}\sum_{i=1}^N (y_i - (wX_i + b))^2$

代码实现

import numpy as np

class LinearRegression:
    def __init__(self):
        self.w = None  # 权重
        self.b = None  # 偏置

    def fit(self, X, y, learning_rate=0.01, epochs=1000):
        # 初始化参数
        n_samples, n_features = X.shape
        self.w = np.zeros(n_features)
        self.b = 0

        # 梯度下降
        for _ in range(epochs):
            y_pred = np.dot(X, self.w) + self.b
            
            # 计算梯度
            dw = (1/n_samples) * np.dot(X.T, (y_pred - y))
            db = (1/n_samples) * np.sum(y_pred - y)
            
            # 更新参数
            self.w -= learning_rate * dw
            self.b -= learning_rate * db

    def predict(self, X):
        return np.dot(X, self.w) + self.b

使用示例

# 生成示例数据
X = np.array([[1], [2], [3], [4]])
y = np.array([2, 4, 6, 8])

# 训练模型
model = LinearRegression()
model.fit(X, y)

# 预测
print(model.predict(np.array([[5]])))  # 输出接近10

关键点说明

梯度下降：通过迭代调整参数使损失函数最小化
学习率：控制参数更新步长，过大可能无法收敛，过小收敛慢
特征缩放：在实际应用中建议对特征做标准化处理

扩展建议

添加正则化（L1/L2）防止过拟合
实现批量梯度下降/随机梯度下降变体
添加模型评估指标（如R²分数）

这段代码完整实现了线性回归的核心逻辑，包含训练和预测功能，适合初学者理解算法本质。实际应用时可结合Scikit-learn等库进行优化。

公式解析

该公式表示均方误差损失函数（Mean Squared Error, MSE），常用于回归问题的模型训练中，用于衡量模型预测值与真实值之间的差异。

符号说明：
- $N$：样本数量。
- $y_i$：第 $i$ 个样本的真实值。
- $X_i$：第 $i$ 个样本的特征向量。
- $w$：模型权重参数（可能是标量或向量，取决于 $X_i$ 的维度）。
- $b$：偏置项（截距）。
- $wX_i + b$：模型的线性预测值。

数学意义

公式计算所有样本的预测误差平方的平均值：

对每个样本，计算预测值 $wX_i + b$ 与真实值 $y_i$ 的差值。
对差值取平方，消除正负影响并放大较大误差。
对所有样本的平方误差求和并除以样本数 $N$，得到平均误差。

代码实现（Python）

import numpy as np

def mean_squared_error(y_true, y_pred):
    """
    计算均方误差损失
    :param y_true: 真实值数组，形状 (N,)
    :param y_pred: 预测值数组，形状 (N,)
    :return: MSE 标量值
    """
    return np.mean((y_true - y_pred) ** 2)

# 示例用法
y_true = np.array([3, 5, 7])
y_pred = np.array([2.5, 5.1, 7.8])
mse = mean_squared_error(y_true, y_pred)
print(f"MSE: {mse:.4f}")

优化目标

在训练中，通过调整 $w$ 和 $b$ 最小化 $L$：

使用梯度下降等优化算法，计算 $L$ 对 $w$ 和 $b$ 的偏导数：
- $\frac{\partial L}{\partial w} = -\frac{2}{N}\sum_{i=1}^N X_i(y_i - (wX_i + b))$
- $\frac{\partial L}{\partial b} = -\frac{2}{N}\sum_{i=1}^N (y_i - (wX_i + b))$
迭代更新参数直至收敛。

开源鸿蒙跨平台开发者社区

开源鸿蒙跨平台开发社区汇聚开发者与厂商，共建“一次开发，多端部署”的开源生态，致力于降低跨端开发门槛，推动万物智联创新。

更多推荐

Expo SDK 54 下 React Native 新老架构选型与低配设备内存优化指南

首选新架构（实测表明，在消除了大图解压和 WebView 浪费后，新架构在低配设备上的内存表现（388.4 MB）甚至优于老架构！并且新架构的 Fabric 渲染引擎能带来更顺畅的滑动体验。第三方音视频 / 直播 SDK 对接规范接入复杂的第三方音视频/直播 SDK 时，建议采用“原生全屏 Activity / ViewController”的调用方式（并在 Android 端配置独立进程这种方式

开源鸿蒙跨平台开发者社区

《HarmonyOS 状态管理源码深度解析：从字节码到像素的完整链路》

本文深入剖析了HarmonyOS NEXT生态中ArkUI状态管理系统的底层机制。通过分析OpenHarmony SDK(API12+)和ArkCompiler源码，全面揭示了状态变量从声明到渲染更新的全生命周期过程。主要内容包括：编译器前端的装饰器转换与增量更新代码生成机制；运行时SynthesizedProperty的内存布局、依赖收集和脏标记传播原理；四大装饰器(@State/@Prop/@