线性回归算法介绍

例子：
这是一个预测房价的，有一个数据集，包含了某处的房子的大小和价格。

尺寸(x)	价格(y)
2104	460
1416	232
1534	315
852	178
…	…

现在需要做的就是从这个数据中学习预测房屋价格。

这里说明一下变量定义：

m = 训练数据集数量
x = 输入变量，也成特征值（feature）
y = 输出变量，即目标值
h = 通过学习算法的到的输出函数（hypothesis function）

我们一般使用(x, y)来表示一个训练样本，例如上面的(2104, 460)…
用 ($x^{(i)}$, $y^{(i)}$) 来表示第 i 个训练样本，上标 i 即为数据集的索引，从 1 开始

监督学习过程（这里用了吴恩达课程的图片）

这张图上，我们通过机器学习算法和数据集来获得一个预测函数h，然后当有新的输入值时，通过这个函数获得新的预测值。
在上面的例子中，新的输入值就是提供一个新的房子尺寸，然后需要得到该房子的预测价格。

如何定义预测函数 h

我们先用一个简单的线性函数来表示：
$h_\theta(x) = \theta_0 + \theta_1x$（有时简单起见，$h_\theta(x)$会缩写成$h(x)$）
这意味着这个预测函数是一个线性函数，至于为什么不选择一个复杂的非线性的函数，这是我们都是从简到难，一步步由简单的线性函数到复杂的模型。

线性回归图表（这里用了吴恩达课程的图片）

这个简单的模型就是线性回归模型（ linear regression），而且这是一个单个变量的线性回归模型，单变量即为$x$，这个是根据$x$来预测房价的函数，因此这个模型还有另外一个名称 单变量线性回归