本文从kazenoyumechen.wordpress.com上迁移过来
本文是一篇未完成的博文


Logistic Regression在现实中是有效解决分类问题的分类算法之一。这个算法是处理二值分类问题的一个有效算法。二值分类问题指的是,数据集中的标签y只能取值为0或1。

按常理来说Linear Rgression也能应用到二值分类问题中,在这种情况下,当,当, 。但是由于Linear Regression的特点,异常值的出现会严重影响其分类效果,所以Linear Regression并不太适合于用作分类问题。

现有训练集,,其中,在Logistic Regression中,估值函数。由估值函数定义域可知,其值域。该函数图像如下图所示:
figure_1

同时,在Logistic Regression中,定义Cost Function:
figure_2

从Cost Function定义可看出,当$latex h_{\theta}(x)$分类越不确定时,CostFunction的值越大。同时定义目标函数

求解该分类问题,实质上就是使得最小,又因

那么是凸函数,因此,该等式可用gradient descent解决。