例子:
这是一个预测房价的,有一个数据集,包含了某处的房子的大小和价格。

尺寸(x) 价格(y)
2104 460
1416 232
1534 315
852 178

现在需要做的就是从这个数据中学习预测房屋价格。

这里说明一下变量定义:

  • m = 训练数据集数量
  • x = 输入变量,也成特征值(feature)
  • y = 输出变量,即目标值
  • h = 通过学习算法的到的输出函数(hypothesis function)

我们一般使用(x, y)来表示一个训练样本, 例如上面的(2104, 460)…
用 ($x^{(i)}$, $y^{(i)}$) 来表示第 i 个训练样本,上标 i 即为数据集的索引,从 1 开始

监督学习过程(这里用了吴恩达课程的图片)

这张图上,我们通过机器学习算法和数据集来获得一个预测函数h,然后当有新的输入值时,通过这个函数获得新的预测值。
在上面的例子中,新的输入值就是提供一个新的房子尺寸,然后需要得到该房子的预测价格。

如何定义预测函数 h

我们先用一个简单的线性函数来表示:
$h_\theta(x) = \theta_0 + \theta_1x$(有时简单起见,$h_\theta(x)$会缩写成$h(x)$)
这意味着这个预测函数是一个线性函数,至于为什么不选择一个复杂的非线性的函数,这是我们都是从简到难,一步步由简单的线性函数到复杂的模型。

线性回归图表(这里用了吴恩达课程的图片)

这个简单的模型就是线性回归模型( linear regression),而且这是一个单个变量的线性回归模型,单变量即为$x$,这个是根据$x$来预测房价的函数,因此这个模型还有另外一个名称 单变量线性回归