求大神指点:对于相同数据,利用二项probit模型的优度比二项logit模型优度要好,可不可以说是因为数据相对服从正态分布导致的两种模型的优劣?

0
已邀请:
2

SmartMining - 数据挖掘、商业智能、大数据从业者:相关产品设计、项目管理、咨询、培训 2016-03-10 回答

     logistic回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最为常用的就是二分类的logistic回归。
   logistic回归的主要用途:一是寻找危险因素,如寻找某一疾病的危险因素等。二是预测,如果已经建立了logistic回归模型,则可以根据模型,预测在不同的自变量情况下,发生某病或某种情况的概率有多大。三是判别,实际上跟预测有些类似,也是根据logistic模型,判断某人属于某病或属于某种情况的概率有多大,也就是看一下这个人有多大的可能性是属于某病。
   这是logistic回归最常用的三个用途,实际中的logistic回归用途是极为广泛的,logistic回归几乎已经成了流行病学和医学中最常用的分析方法,因为它与多重线性回归相比有很多的优势,这些优势将在以后的文章中一一介绍。
logit模型也叫Logistic模型,服从Logistic分布。probit模型服从正态分布。
两个模型都是离散选择模型的常用模型。但logit模型简单直接,应用更广。
probit模型是一种广义的线性模型。服从正态分布。
最简单的probit模型就是指被解释变量Y是一个0,1变量,事件发生地概率是依赖于解释变量,即P(Y=1)=f(X),也就是说,Y=1的概率是一个关于X的函数,其中f(.)服从标准正态分布。若f(.)是累积分布函数,则其为Logistic模型

要回复问题请先登录注册