逻辑回归是一种分类技术,它使用监督学习来估计目标变量的可能性。因为目标或因变量的性质是二分的,所以只有两个可行的类别。简单地说,因变量本质上是二进制的,数据表示为1代表成功和是,0代表失败和否。
逻辑回归模型在数学上将P(Y=1)预测为X的函数。它是最基本的ML技术之一,可用于解决各种分类问题。
一般而言,逻辑回归是指具有二元目标变量的二元逻辑回归,但它也可能预测其他两种类型的目标变量。Logistic回归根据类别的数量可以分为以下几类:
二项式或二元式:这种分类形式中的因变量只有两个潜在值1或0。这些变量可能表示成功或失败、是或否等。
多项式:此类分类中的因变量可以具有三个或更多可选的无序类别或类型,没有数量意义。例如,这些变量可能表示“A类”、“B类”或“C类”。
序数:在这种分类中,因变量可能具有三个或更多具有定量意义的潜在有序类别或类型。例如,这些变量可能表示“差”或“好”、“很好”或“优秀”,分数范围为0到2。
机器学习中逻辑回归的假设
在深入研究逻辑回归之前,必须了解以下有关的假设。
- 二元逻辑回归中的目标变量必须始终是二元的,预期结果由因子水平1表示。
- 该模型不应有任何多重共线性,这表明自变量必须相互独立。
- 模型必须包含相关变量。