机器学习(04)Logistic回归

什么是Logistic回归

什么是回归

假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归

Logistic回归分类的主要思想是:根据现有数据边界线建立回归公式,以此进行分类。这里的"回归"一词,源于最佳拟合,在训练分类器时的主要做法就是寻找最佳拟合参数集,这其中运用到的就是最优化算法(可以找到最优解的算法)。

其中回归过程中运用到的数学原理的核心,就是Logistic函数

什么是Logistic

Logistic函数Logistic曲线是一种常见的S形函数,它是皮埃尔·弗朗索瓦·韦吕勒在1844或1845年在研究它与人口增长的关系时命名的。广义Logistic曲线可以模仿一些情况人口增长(P)的S形曲线。起初阶段大致是指数增长;然后随着开始变得饱和,增加变慢;最后,达到成熟时增加停止。

举个栗子

简单来说如果想了解到底哪些因素是胃癌的危险因素,我们就可以使用Logistic回归来处理。

想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。通过Logistic回归分析,我们可以大致了解到底哪些因素是胃癌的危险因素。

坚持原创技术分享,您的支持将鼓励我继续创作!