本篇将总结逻辑回归(Logistic Regression)的相关内容。
逻辑回归(Logistic Regression)
逻辑回归:指的是将数据分类,使之得到离散的结果的方法。例如,我们能够使用逻辑回归对电子邮件进行分类,用以区分垃圾邮件和非垃圾邮件。
分类(Classification)
定义:我们通过尝试预测一个结果是否属于某一个类。例如,正确或者错误。下面是一些分类问题的例子。
注意:逻辑回归算法的输出值永远在0到1之间。
假说表示(Hypothesis Representation)
逻辑回归中,模型的输出需要满足变量范围在0和1之间。假设函数的表达式如下:
$$h_{\theta}(x) = g(\theta^{T}X)$$
其中,X代表了特征向量。
g代表了逻辑函数(logistic function),常用的逻辑函数是一个S形函数(Sigmoid function),公式为$g(z) = \frac{1}{1+e^{-z}}$。图像如下:
综上,表达式为:$h_{\theta}(x) = \frac{1}{1+e^{-\theta^TX}}$
它的作用是:
对于给定的输入变量,根据选择的参数计算输出变量等于1的可能性(estimated probablity),即$h_{\theta} = P(y=1|x;\theta)$。