本文从kazenoyumechen.wordpress.com上迁移过来
本文是一篇未完成的博文
Logistic Regression在现实中是有效解决分类问题的分类算法之一。这个算法是处理二值分类问题的一个有效算法。二值分类问题指的是,数据集中的标签y只能取值为0或1。
按常理来说Linear Rgression也能应用到二值分类问题中,在这种情况下,当,,当, 。但是由于Linear Regression的特点,异常值的出现会严重影响其分类效果,所以Linear Regression并不太适合于用作分类问题。
现有训练集,,其中,,在Logistic Regression中,估值函数。由估值函数定义域可知,其值域。该函数图像如下图所示:
同时,在Logistic Regression中,定义Cost Function:
从Cost Function定义可看出,当$latex h_{\theta}(x)$分类越不确定时,CostFunction的值越大。同时定义目标函数
求解该分类问题,实质上就是使得最小,又因
那么是凸函数,因此,该等式可用gradient descent解决。