From 1ecefabff30ea1af2ae49bb118fd974a1b4ae529 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Tue, 20 Sep 2016 10:34:36 +0200 Subject: [PATCH 01/14] Update README.md add yinruiqing to this group --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index 85fb722..38b7f8e 100644 --- a/README.md +++ b/README.md @@ -53,7 +53,7 @@ |[2 Linear Algebra](http://www.deeplearningbook.org/contents/linear_algebra.html) | | | |[3 Probability and Information Theory](http://www.deeplearningbook.org/contents/prob.html)|@gjoker|| |[4 Numerical Computation](http://www.deeplearningbook.org/contents/numerical.html)|@mathshen|| -|[5 Machine Learning Basics](http://www.deeplearningbook.org/contents/ml.html)||| +|[5 Machine Learning Basics](http://www.deeplearningbook.org/contents/ml.html)|@yinruiqing|| |[Part II: Modern Practical Deep Networks](http://www.deeplearningbook.org/contents/part_practical.html)|----|----| |[6 Deep Feedforward Networks](http://www.deeplearningbook.org/contents/mlp.html)|@francis7999|| |[7 Regularization](http://www.deeplearningbook.org/contents/regularization.html)||| From a20f2f416534d39d6a8c969f47b6151664413581 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Tue, 20 Sep 2016 10:43:59 +0200 Subject: [PATCH 02/14] Create part_1_chapter_5 --- part_1_chapter_5 | 1 + 1 file changed, 1 insertion(+) create mode 100644 part_1_chapter_5 diff --git a/part_1_chapter_5 b/part_1_chapter_5 new file mode 100644 index 0000000..8b13789 --- /dev/null +++ b/part_1_chapter_5 @@ -0,0 +1 @@ + From 2730faf7c4afe363aa564dd7fb9a7db339324cd1 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Tue, 20 Sep 2016 10:53:03 +0200 Subject: [PATCH 03/14] Move file part_1_chapter_5 to part_1_chapter_5.md --- part_1_chapter_5 => part_1_chapter_5.md | 0 1 file changed, 0 insertions(+), 0 deletions(-) rename part_1_chapter_5 => part_1_chapter_5.md (100%) diff --git a/part_1_chapter_5 b/part_1_chapter_5.md similarity index 100% rename from part_1_chapter_5 rename to part_1_chapter_5.md From b099acaec193fc64936879a69e4788263c317432 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Tue, 20 Sep 2016 10:53:51 +0200 Subject: [PATCH 04/14] Update part_1_chapter_5.md --- part_1_chapter_5.md | 4 ++++ 1 file changed, 4 insertions(+) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index 8b13789..687a28a 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -1 +1,5 @@ +# 机器学习基础 + + + From 2b913c10f1befda2583ab62720738ede1b5590a3 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Tue, 20 Sep 2016 11:07:55 +0200 Subject: [PATCH 05/14] Update part_1_chapter_5.md --- part_1_chapter_5.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index 687a28a..d320334 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -1,5 +1,5 @@ # 机器学习基础 - +深度学习其实也是机器学习的一种方法。为了更好的理解深度学习,我们必须也要了解一下机器学习的基础知识。这章给大家简要介绍了机器学习中一些重要的概念,这些内容在本书的后续章节会涉及到。如果你是初学者或者想对机器学习更详细的 From 1ac02cf6a99f410ba2907186c8bbce0530126034 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 10:32:50 +0200 Subject: [PATCH 06/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- SUMMARY.md | 2 ++ part_1_chapter_5.md | 9 ++++++++- 2 files changed, 10 insertions(+), 1 deletion(-) diff --git a/SUMMARY.md b/SUMMARY.md index 84616cd..7c832ed 100644 --- a/SUMMARY.md +++ b/SUMMARY.md @@ -1,3 +1,5 @@ # Summary * [First Chapter](chapter1.md) +* [Chapter 5](/part_1_chapter_5.md) + diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index d320334..c79bfbe 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -1,5 +1,12 @@ - # 机器学习基础 深度学习其实也是机器学习的一种方法。为了更好的理解深度学习,我们必须也要了解一下机器学习的基础知识。这章给大家简要介绍了机器学习中一些重要的概念,这些内容在本书的后续章节会涉及到。如果你是初学者或者想对机器学习更详细的 +## 5.1 机器学习算法 + +### 5.1.1 任务 T + +机器学习可以解决一些传统的算法很难解决的问题,之前我们总会用人为设计的固定的算法来解决一些问题。从一个科学或者哲学的观点来看,机器学习之所以有趣,是因为在发展理解机器学习算法的同时,我们也会思考发现人类智能的本质。人是如何思考的。 + +我们用一个相对正式的 + From 7d19edd6db7718ba362e91aa2a103ed1b1c31fe6 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 10:50:29 +0200 Subject: [PATCH 07/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 10 ++++++++-- 1 file changed, 8 insertions(+), 2 deletions(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index c79bfbe..cb57fcf 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -4,9 +4,15 @@ ## 5.1 机器学习算法 -### 5.1.1 任务 T +### 5.1.1 任务 $$T$$ 机器学习可以解决一些传统的算法很难解决的问题,之前我们总会用人为设计的固定的算法来解决一些问题。从一个科学或者哲学的观点来看,机器学习之所以有趣,是因为在发展理解机器学习算法的同时,我们也会思考发现人类智能的本质。人是如何思考的。 -我们用一个相对正式的 +在这一段,我们会给任务 T 一个相对正式的定义。学习本身的过程不能称之为任务,学习的目的是为了获得完成任务的能力。举个例子: 如果我们制作出了一个机器人,想让它具有走路能力,那么走路就是任务T。我们可以写一个程序让机器人自己学习如何走路,也可以直接写一个程序直接控制机器人走路。 + +机器学习任务通常机器学习系统如何处理一个个实例 Example。实例是特征的集合。这些特征来自于我们设计的机器学习系统需要处理的事件或者物体,而且都已经被量化了。我们通常把实例表示成一个向量,向量的每个元素表示不同的特征。比如说图像的特征通常就是图像的像素值。 + +机器学习可以解决很多不同的任务。下面我列举了最常见的机器学习任务 + +* **分类 ** From 8477d218f92477ca3d2331c987c17e13c12e29af Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 10:55:23 +0200 Subject: [PATCH 08/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index cb57fcf..8816f43 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -14,5 +14,5 @@ 机器学习可以解决很多不同的任务。下面我列举了最常见的机器学习任务 -* **分类 ** +* **分类 **在这类任务中,总共有k类,计算机算法需要判断每个输入属于哪个类别。为了完成这个任务,学习算法通常需要 From 4836f99d07ea7a6f0cca9bcb5206bfbba06c3086 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 12:05:48 +0200 Subject: [PATCH 09/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 6 +++++- 1 file changed, 5 insertions(+), 1 deletion(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index 8816f43..123c4fe 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -14,5 +14,9 @@ 机器学习可以解决很多不同的任务。下面我列举了最常见的机器学习任务 -* **分类 **在这类任务中,总共有k类,计算机算法需要判断每个输入属于哪个类别。为了完成这个任务,学习算法通常需要 +* **分类 **在这类任务中,总共有k类,计算机算法需要判断每个输入属于哪个类别。为了完成这个任务,学习算法通常需要产生一个函数,或者叫对应关系。模型会将每个输入x对应到某个类别y。当然也有很多类似的分类任务,比如说f输出一个概率分布,每个类别对应一个概率。物体识别就是分类任务的一个例子。这个任务重输入时一幅图片 通常可以描述成像素值的集合。输出是图片中物体对应的编码。比如说机器人 就可以识别不同的饮料,并把他们送给点单的客人。深度学习在完成目标检测都有较好的效果。同时,目标检测的算法也可以用于人脸识别,这样我们就可以对照片里的每个人进行自动标注了,而且也可以帮助计算机更好的和人类进行交互。 +* **缺失特征情况下的分类 ** 如果一些数据缺失某些特征的化,分类问题会变得比较难。也就是说不能保证输入向量里每个对应的特征都可以提供。不同的x缺德特征也有可能不一样。传统的分类任务中,学习算法需要定义一个函数,能够将输入向量映射到一个输出类别。但如果一些输入特征缺失了,学习算法就需要定义一系列函数, +* 回归 在这类任务重,计算机程序需要根据输入预测一下数值。为了解决这个问题,学习算法需要得到一个函数 这类人物和分类任务很像,唯一的不同就是输出的格式不一样,分类任务要求输出的是输入对应的类别,是离散的,而回归任务要求的输出是连续的数值。 +* 描述 在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别, + From a96e0c5119830d341cabbff4f97fd47fc6b7a383 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 12:35:03 +0200 Subject: [PATCH 10/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index 123c4fe..b12b70b 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -17,6 +17,7 @@ * **分类 **在这类任务中,总共有k类,计算机算法需要判断每个输入属于哪个类别。为了完成这个任务,学习算法通常需要产生一个函数,或者叫对应关系。模型会将每个输入x对应到某个类别y。当然也有很多类似的分类任务,比如说f输出一个概率分布,每个类别对应一个概率。物体识别就是分类任务的一个例子。这个任务重输入时一幅图片 通常可以描述成像素值的集合。输出是图片中物体对应的编码。比如说机器人 就可以识别不同的饮料,并把他们送给点单的客人。深度学习在完成目标检测都有较好的效果。同时,目标检测的算法也可以用于人脸识别,这样我们就可以对照片里的每个人进行自动标注了,而且也可以帮助计算机更好的和人类进行交互。 * **缺失特征情况下的分类 ** 如果一些数据缺失某些特征的化,分类问题会变得比较难。也就是说不能保证输入向量里每个对应的特征都可以提供。不同的x缺德特征也有可能不一样。传统的分类任务中,学习算法需要定义一个函数,能够将输入向量映射到一个输出类别。但如果一些输入特征缺失了,学习算法就需要定义一系列函数, * 回归 在这类任务重,计算机程序需要根据输入预测一下数值。为了解决这个问题,学习算法需要得到一个函数 这类人物和分类任务很像,唯一的不同就是输出的格式不一样,分类任务要求输出的是输入对应的类别,是离散的,而回归任务要求的输出是连续的数值。 -* 描述 在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别, - +* 描述 在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别,计算机程序会根据输入的波形来判断我们说的话。然后将它们转成文字或者文字对应的编码。现在深度学习是语音识别系统一个非常重要的组成部分,已经被好多大公司使用,包括微软,IBM,谷歌。 +* 机器翻译 在机器翻译任务中,我们需要将某种语言的序列翻译成另一种语言的对应的序列。这是自然语言处理的的一部分,比如说将音乐翻译成法语。深度学习在这些任务中,表现的越来越出色。 +* 结构化输出 这类任务一般都要求输出是一个向量,或者其他的数据结构 From 381f9d2db987254be20ce2cdf52f4e8a60c6a878 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 12:37:25 +0200 Subject: [PATCH 11/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index b12b70b..cdaeb2c 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -19,5 +19,5 @@ * 回归 在这类任务重,计算机程序需要根据输入预测一下数值。为了解决这个问题,学习算法需要得到一个函数 这类人物和分类任务很像,唯一的不同就是输出的格式不一样,分类任务要求输出的是输入对应的类别,是离散的,而回归任务要求的输出是连续的数值。 * 描述 在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别,计算机程序会根据输入的波形来判断我们说的话。然后将它们转成文字或者文字对应的编码。现在深度学习是语音识别系统一个非常重要的组成部分,已经被好多大公司使用,包括微软,IBM,谷歌。 * 机器翻译 在机器翻译任务中,我们需要将某种语言的序列翻译成另一种语言的对应的序列。这是自然语言处理的的一部分,比如说将音乐翻译成法语。深度学习在这些任务中,表现的越来越出色。 -* 结构化输出 这类任务一般都要求输出是一个向量,或者其他的数据结构 +* 结构化输出 这类任务一般都要求输出是一个向量,或者其他能够存储多个值的数据结构。这样的任务太多了,包括我们上面提到的描述和机器翻译。当然还有一些其他的任务,比如说 将 From 0d7732e3bb40d228087516a8fd90da1e8916f0e2 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 14:37:23 +0200 Subject: [PATCH 12/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 5 +++++ 1 file changed, 5 insertions(+) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index cdaeb2c..46a3f15 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -20,4 +20,9 @@ * 描述 在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别,计算机程序会根据输入的波形来判断我们说的话。然后将它们转成文字或者文字对应的编码。现在深度学习是语音识别系统一个非常重要的组成部分,已经被好多大公司使用,包括微软,IBM,谷歌。 * 机器翻译 在机器翻译任务中,我们需要将某种语言的序列翻译成另一种语言的对应的序列。这是自然语言处理的的一部分,比如说将音乐翻译成法语。深度学习在这些任务中,表现的越来越出色。 * 结构化输出 这类任务一般都要求输出是一个向量,或者其他能够存储多个值的数据结构。这样的任务太多了,包括我们上面提到的描述和机器翻译。当然还有一些其他的任务,比如说 将 +* 异常检测 在这类任务中,计算机程序会对输入的事件和目标进行筛选,找出那些异常的的事件或者事物。信用卡欺诈检测就是这类任务的一个例子。通过对你的消费习惯进行建模,当你的卡被盗刷的时候,信用卡公司可以检测出来这个异常事件。当小偷盗取了你的行用卡或者信用卡信息,他进行消费的时候,这些消费记录会和你的消费习惯的概率分布不一致。这样信用卡公司在检测到你的信用卡账号有异常购买记录的时候就会直接把你的信用卡给锁了。可以看一下,里面介绍了一些异常检测的方法。 + +* 模仿合成及采样 在这类任务中,机器学习算法或生成一些和训练数据相似的数据。这类任务在艺术和多媒体领域很有用,艺术家进行创造的过程是很枯燥的,而且要花费大量的经历。比如说,在电脑游戏中,我们可以自动生成一些物品和风景。而不是依靠艺术家一点一点画出来。当然我们也可以接收一些比较特殊的输入。比如说语音合成,我们输入一个句子,然后程序就会合成这个句子对应的语音波形。这也是上文提到的结构化输出任务,但是在这个任务中每个输入并没有对应的唯一的正确的输出。我们期望输出会有多一点的变化,这样就会让人感觉更加自然和真实。 +* 缺失值预测 在这类任务中,机器学习算法 + From fd81f1251cc9eb8a1d44465970b5afc518054da9 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Wed, 21 Sep 2016 15:05:13 +0200 Subject: [PATCH 13/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 12 ++++++------ 1 file changed, 6 insertions(+), 6 deletions(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index 46a3f15..b8150ea 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -16,13 +16,13 @@ * **分类 **在这类任务中,总共有k类,计算机算法需要判断每个输入属于哪个类别。为了完成这个任务,学习算法通常需要产生一个函数,或者叫对应关系。模型会将每个输入x对应到某个类别y。当然也有很多类似的分类任务,比如说f输出一个概率分布,每个类别对应一个概率。物体识别就是分类任务的一个例子。这个任务重输入时一幅图片 通常可以描述成像素值的集合。输出是图片中物体对应的编码。比如说机器人 就可以识别不同的饮料,并把他们送给点单的客人。深度学习在完成目标检测都有较好的效果。同时,目标检测的算法也可以用于人脸识别,这样我们就可以对照片里的每个人进行自动标注了,而且也可以帮助计算机更好的和人类进行交互。 * **缺失特征情况下的分类 ** 如果一些数据缺失某些特征的化,分类问题会变得比较难。也就是说不能保证输入向量里每个对应的特征都可以提供。不同的x缺德特征也有可能不一样。传统的分类任务中,学习算法需要定义一个函数,能够将输入向量映射到一个输出类别。但如果一些输入特征缺失了,学习算法就需要定义一系列函数, -* 回归 在这类任务重,计算机程序需要根据输入预测一下数值。为了解决这个问题,学习算法需要得到一个函数 这类人物和分类任务很像,唯一的不同就是输出的格式不一样,分类任务要求输出的是输入对应的类别,是离散的,而回归任务要求的输出是连续的数值。 -* 描述 在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别,计算机程序会根据输入的波形来判断我们说的话。然后将它们转成文字或者文字对应的编码。现在深度学习是语音识别系统一个非常重要的组成部分,已经被好多大公司使用,包括微软,IBM,谷歌。 -* 机器翻译 在机器翻译任务中,我们需要将某种语言的序列翻译成另一种语言的对应的序列。这是自然语言处理的的一部分,比如说将音乐翻译成法语。深度学习在这些任务中,表现的越来越出色。 -* 结构化输出 这类任务一般都要求输出是一个向量,或者其他能够存储多个值的数据结构。这样的任务太多了,包括我们上面提到的描述和机器翻译。当然还有一些其他的任务,比如说 将 +* **回归 **在这类任务重,计算机程序需要根据输入预测一下数值。为了解决这个问题,学习算法需要得到一个函数 这类人物和分类任务很像,唯一的不同就是输出的格式不一样,分类任务要求输出的是输入对应的类别,是离散的,而回归任务要求的输出是连续的数值。 +* **描述 **在这类任务中,机器学习系统需要观察一些非结构化数据,然后用文字或者离散化的符号描述它们。比如说文字识别,计算机程序需要识别出图片中所包含的文字,然后将识别出来的文字返回。谷歌的 就是利用深度学习来街道号码的。另一个例子是语音识别,计算机程序会根据输入的波形来判断我们说的话。然后将它们转成文字或者文字对应的编码。现在深度学习是语音识别系统一个非常重要的组成部分,已经被好多大公司使用,包括微软,IBM,谷歌。 +* **机器翻译** 在机器翻译任务中,我们需要将某种语言的序列翻译成另一种语言的对应的序列。这是自然语言处理的的一部分,比如说将音乐翻译成法语。深度学习在这些任务中,表现的越来越出色。 +* **结构化输出** 这类任务一般都要求输出是一个向量,或者其他能够存储多个值的数据结构。这样的任务太多了,包括我们上面提到的描述和机器翻译。当然还有一些其他的任务,比如说 将 * 异常检测 在这类任务中,计算机程序会对输入的事件和目标进行筛选,找出那些异常的的事件或者事物。信用卡欺诈检测就是这类任务的一个例子。通过对你的消费习惯进行建模,当你的卡被盗刷的时候,信用卡公司可以检测出来这个异常事件。当小偷盗取了你的行用卡或者信用卡信息,他进行消费的时候,这些消费记录会和你的消费习惯的概率分布不一致。这样信用卡公司在检测到你的信用卡账号有异常购买记录的时候就会直接把你的信用卡给锁了。可以看一下,里面介绍了一些异常检测的方法。 -* 模仿合成及采样 在这类任务中,机器学习算法或生成一些和训练数据相似的数据。这类任务在艺术和多媒体领域很有用,艺术家进行创造的过程是很枯燥的,而且要花费大量的经历。比如说,在电脑游戏中,我们可以自动生成一些物品和风景。而不是依靠艺术家一点一点画出来。当然我们也可以接收一些比较特殊的输入。比如说语音合成,我们输入一个句子,然后程序就会合成这个句子对应的语音波形。这也是上文提到的结构化输出任务,但是在这个任务中每个输入并没有对应的唯一的正确的输出。我们期望输出会有多一点的变化,这样就会让人感觉更加自然和真实。 -* 缺失值预测 在这类任务中,机器学习算法 +* **模仿合成及采样 **在这类任务中,机器学习算法或生成一些和训练数据相似的数据。这类任务在艺术和多媒体领域很有用,艺术家进行创造的过程是很枯燥的,而且要花费大量的经历。比如说,在电脑游戏中,我们可以自动生成一些物品和风景。而不是依靠艺术家一点一点画出来。当然我们也可以接收一些比较特殊的输入。比如说语音合成,我们输入一个句子,然后程序就会合成这个句子对应的语音波形。这也是上文提到的结构化输出任务,但是在这个任务中每个输入并没有对应的唯一的正确的输出。我们期望输出会有多一点的变化,这样就会让人感觉更加自然和真实。 +* 缺失值预测 在这类任务中,机器学习算法 From c749d90b53f407d7f4e7325e176db8325ec6a3c8 Mon Sep 17 00:00:00 2001 From: yinruiqing Date: Fri, 23 Sep 2016 00:16:27 +0200 Subject: [PATCH 14/14] Updates part_1_chapter_5.md Auto commit by GitBook Editor --- part_1_chapter_5.md | 9 ++++++++- 1 file changed, 8 insertions(+), 1 deletion(-) diff --git a/part_1_chapter_5.md b/part_1_chapter_5.md index b8150ea..2cd1c39 100644 --- a/part_1_chapter_5.md +++ b/part_1_chapter_5.md @@ -1,9 +1,15 @@ # 机器学习基础 -深度学习其实也是机器学习的一种方法。为了更好的理解深度学习,我们必须也要了解一下机器学习的基础知识。这章给大家简要介绍了机器学习中一些重要的概念,这些内容在本书的后续章节会涉及到。如果你是初学者或者想对机器学习更详细的 +深度学习其实也是机器学习的一种方法。为了更好的理解深度学习,我们必须也要了解一下机器学习的基础知识。这章给大家简要介绍了机器学习中一些重要的概念,这些内容在本书的后续章节会涉及到。如果你是初学者或者想对机器学习有更广更详细的了解,推荐你找一本机器学习的教科书。比如说Murphy\(2012\)或者Bishop\(2006\)。如果你已经对机器学习的基础比较熟悉了,你可以直接开始看5.11。那部分内容介绍的传统机器学习技巧对深度学习算法的发展有较大的影响。 + +我们首先会先定义一下什么是机器学习算法。随后我们会给一个例子 线性回归算法。接着我们介绍拟合训练数据和将我们学习到的模型运用到新的数据集的不同之处。大部分机器学习算法会让我们设置超参数。这些超参数是需要我们自己定义的,而不能通过训练过程自动更新。我们也会讨论如何设置超参数。机器学习本质上就是应用统计学。和应用统计学不同的是它强调了了利用计算机来对一些复杂的函数进行统计估计。但是减弱了对估计出来的函数计算置信区间。就是说它利用统计学方法的得出一个模型,但它不强调用传统的假设检验的方式来对该模型进行评估。接着我们会介绍两个核心的统计算法 频率估计 和 贝叶斯推断。频率学派和贝叶斯学派也是统计学的两大流派。大部分机器学习任务可以分为监督学习和无监督学习两类。我们会对这两类做一个介绍,同时会介绍一些它们用到的机器学习算法。大部分深度学习算法是基于一种叫随机梯度下降法的优化算法。我们会介绍如何构建一个完整的机器学习算法。这些算法包含多个部分。优化算法,损失函数,模型和数据集。最后,在5.11我们介绍了传统机器学习算法遇到的一些困难,这些困难促使我们发展深度学习来解决传统机器学习算法所不能解决或者很难解决的问题。 ## 5.1 机器学习算法 +所谓机器学习算法,就是能够从数据中学习的算法。但是学习到底是什么含义。Mitchell 提供了一个定义。一个计算机程序从关于不同类型的任务的经验中进行学习 + +我们可以想象,经验 任务 还有评估策略可以有很多,在这本书中不会给这些名词一个正式的定义。但是我们在接下来的章节中会对他们进行大致的描述,并给一些例子来帮助大家这些名词,已经如何用它们来组成一个机器学习算法。 + ### 5.1.1 任务 $$T$$ 机器学习可以解决一些传统的算法很难解决的问题,之前我们总会用人为设计的固定的算法来解决一些问题。从一个科学或者哲学的观点来看,机器学习之所以有趣,是因为在发展理解机器学习算法的同时,我们也会思考发现人类智能的本质。人是如何思考的。 @@ -26,3 +32,4 @@ * 缺失值预测 在这类任务中,机器学习算法 +