支持向量机(SVM)是用于异常值检测、回归和分类的监督机器学习算法,因为它们在高维领域特别有效,SVM又常被用于分类任务的处理。总的来说,SVM功能强大且适应性强。
支持向量机(SVM)的主要目的是将数据集划分为大量类,以发现最大边际超平面(MMH),这可以分两步完成:
第一步:支持向量机最初将迭代构建最能区分类别的超平面。
第二步:然后它将选择最能分离类的超平面。
超平面的维度取决于特征的数量。如果输入特征的数量是两个,那么超平面只是一条线。如果输入特征的数量是三个,那么超平面就变成了一个二维平面。
为了构造超平面,SVM使用极值向量,因此称为支持向量。SVM算法的主要目标是找到一个具有较大边距的理想超平面,可以通过将其划分为n维空间来创建离散类。
支持向量机(SVM)重要原则
1、支持向量-离超平面最近的数据点称为支持向量。可以使用支持向量来确定分隔线。
2、超平面-将一组项目划分为多个类别的空间或决策平面称为超平面。
3、边距-不同类最近数据点上两条线之间的距离。
4、最大边距-理想的超平面是具有最大边距的超平面。
支持向量机(SVM)内核
支持向量机内核是一个函数,它采用低维输入空间并将其转换为高维空间,即将不可分离问题转换为可分离问题。它主要用于非线性分离问题。简单地说,内核会进行一些极其复杂的数据转换,然后根据定义的标签或输出找出分离数据的过程。
支持向量机(SVM)的优点
1、在高维情况下有效
2、内存效率很高,因为它使用决策函数中称为支持向量的训练点子集
3、可以为决策函数指定不同的内核函数,并且可以指定自定义内核