从零开始的机器学习

1.2 基本术语

预测离散值的学习任务是分类，预测连续值的学习任务是回归。回归任务的输出值范围是整个实数集。

分类和回归属于监督学习，聚类属于无监督学习。

强泛化能力是机器学习的目标，让学得的模型能很好地适用于新样本。

样本符合独立同分布。

1.4 归纳偏好

归纳偏好是在假设空间中对某种类型假设的偏好，避免随机抽取等效假设。

奥卡姆剃刀是最基本的归纳偏好原则，若有多个假设与观察一致，则选择最简单的那个。

算法的归纳偏好是否与问题本身相匹配，大多数时候决定算法是否能取得好的性能。

没有免费午餐定理：对于任意两个学习算法，总误差和期望性能都相同。

算法优劣只是针对具体学习问题。

2.2 评估方法

留出法采用分层采样，训练集一般占60%-80%。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md

Provide feedback