【MOOC手写体】王文敏教授.《人工智能原理》第10章机器学习的任务 Part5 C10.2 Classification 分类...-白红宇

【MOOC手写体】王文敏教授.《人工智能原理》第10章机器学习的任务 Part5 C10.2 Classification 分类...

阅读量：6857 次

发布时间：2019-06-26

本文共 3495 字，大约阅读时间需要 11 分钟。

写在前面：想了一下，这门MOOC可能更适合大一、大二的本科生，和跨专业学生吧。 本文属于知识分享。有兴趣的朋友可以结合MOOC看这篇“音译”。

P5 C10.2——15分59秒

下面，我们讲第十章第一节，Classification，分类。

我们首先给出分类的定义，根据定义描述的长度，我们给出三种定义。

首先给出一个较长的定义。分类是这样一种任务，它基于已知类别的训练数据集，来辨识新的观测数据属于哪一组类别。

较短的描述，分类用于解决这样一些问题，其中输出被分为两个或多个类别。

最短的描述，分类是对每个输入数据下指定一个类别。

这三种定义尽管描述的长短不同，但他们对分类的要素是相同的。也就是说，对输入数据划分为类别，并且这个类别是已知的。

第一节分成四个小节。首先我们看一下分类是如何工作的。

分类需要有一个分类器，Classifier。

什么是分类器呢？它是一种实现分类功能，尤其是一种具体去实现分类的算法，被称为一个分类器Classifier。

下面我们介绍一下分类函数，Classifier function。

分类器这个术语，有时还指的是由分类算法所实现的数学函数，它将输入数据映射为一个类别。

这张图刻画了分类的训练过程，即Training。

训练数据是一个已标注的数据，Labeled Data。即这些训练数据的类别是已知的。

有一个x，通过labeling function，标注得到y。

标注的目的呢，是创建训练样本。通常采用手工标注的方法。

训练样本建立好之后，就用来对学习算法f(x)进行训练。

每次输入一组(x, y)的训练数据。通过训练之后，我们希望得到一个h(x)。h(x)是Hypothesis，假定函数集合当中的一个函数，它也被称为，叫做分类函数。

这个分类函数h(x)，和我们目标的f(x)之间，要满足具有最小的泛化和经验错误。

分类算法训练好了之后我们得到了h(x)，就可以用来进行实际的分类了。

我们如图所示。这个时候的输入数据是未知数据。我们根据已经训练好的假定函数h(x)进行分类，得到相应的 y 的映像，最后得到分类结果。

我们看，在未知类别的时候，通过分类，得到了已知的类别。

刚才的两页分别是分类算法的训练和实测的示意图。

下面给出一种分类的形式化描述。

设Rⁿ表示一个n维实数向量集合。输入空间X是Rⁿ的子集，输出空间 Y ，是一个类别，categories。D是X与Y笛卡尔积上的一个未知分布。

我们给定一个标注函数labeling function，这个labeling function也可以称其为分类函数classifier function。然后给定一个训练的集合，training dataset，也称为标注好的训练样本集合。训练样本集合S表示为x⁽ⁱ⁾和y^(j)元素的集合。其中(x, y)属于大写的X，Y的笛卡尔乘积，i和j的取值范围分别为1到m和1到n。

分类算法要给定一个假定函数集合。大写的H是X到Y的一个映射的函数。我们的目的是得到一个假定的函数，属于大写的H集合当中的一个小写的h, h是X到Y的映射。我们的目的是，使得h(x)与我们既定的f(x)之间，具有最小的泛化错误和经验错误。

把分类算法训练好以后，已经得到了h(x)。我们在实际的分类处理过程中，就是对未知的数据进行实际测试，未知的数据我们可以表示成一个大写的X的集合。我们使用刚才已经训练好的classifier function，小写的h(x)，将X映射到Y的过程。我们通过分类得到这样一个分类的集合，小写的y属于大写的Y的空间，并且呢j属于1到n。它是通过每一个x向量，将其映射到y的向量的这么个过程。其中大写的Y是输出空间，它被称为一个叫做已知的类别的集合。

下面我们讲第二小节，线性分类和非线性分类。

首先我们看线性分类。

所谓线性分类，是通过线性分类器进行分类的。我们如图所示，我们会看到有这样一个线性的将二维数据空间的数据分成两个类别。

一个线性分类器具有如下两个特征：

首先，它是一个线性判别函数，此外它还具有一个线性决策边界 linear decision boundary。

我们给一个简单的线性分类器的案例分析。

这是一个简单的线性分类器的一个表达式，其中w表示行向量，它是权值的向量，x则表示为列向量，记作这个表达式，其中b则表示偏差值。从右图可以看出，我们这个线性分类函数，当结果等于0的时候恰好为这一条线。大于0和小于0，分别将数据分成两个类，因此它是一个线性的二元分类的例子。

我们再看一下非线性分类。

所谓的非线性分类，是通过一个非线性分类器进行分类的。非线性分类器也有如下两个特点：

第一，有若干个非线性决定边界。

二，决定边界很可能是非连续的。

下面这个图呢，就是一个非线性分类的例子。它通过支持向量机SVM中的和函数，来解决非线性分类问题。关于支持向量机及其和函数的介绍的书籍和参考资料有很多，感兴趣的可以到网上查阅一下。