缘起

lasso是由1996年Robert Tibshirani首次提出,全称Least absolute shrinkage and selection operator,是一种采用了L1正则化(L1-regularization)的线性回归方法,本号前期发过多篇专题:

几种常见的预测模型-LASSO回归在临床预测模型中的3种用法!_80楼网赚论坛|80楼网创

临床预测模型,近年已经进入爆发模式。Lasso回归也频频见于预测模型文中,松哥本期给大家总结整理LASSO在临床预测模型中的常见几种用法

用法一:

这也是最常见的用法,采用LASSO进行回归,根据10重交叉验证,筛选得到最优的模型,也就是拿到筛选得到的预测因子。

然后用筛选得到的因子,继续做后续的多因素Logsitic回归或者多因素COX回归,得到最终的临床预测模型,用于后续的区分度、校准度、临床实用度以及Nomogram的制作。

Nomogram-Based Prediction of the Risk of Diabetic Retinopathy:

A Retrospective Study

如上述这篇文章,采用LASSO回归,对19个预测因子进行筛选,最终选得7个预测因子。然后对7个预测因子构建多因素Logistic回归模型

然后作者就基于这7个因素,构建了Nomogram,并进行了后续3个度的评价。

用法二:

当我们研究的因素较多几种常见的预测模型,可以先进行单因素Logistic或COX回归,先筛选一批可能的预测因子;

然后再采用LASSO回归进行筛选,将筛选得到的预测因子,再次进行多因素Logistic或COX回归,确定最终模型。如下这篇文章所述:

文章:Nomogram for predicting overall survival in stage II-III colorectal cancer

作者单变量分析发现59个因素,基于专业有加上5个P>0.05的因素(大家可以学习这种表达,有的时候我们建模,发现某个专业上有意义的变量,却没有进入多因素分析阶段,可以通过这样的表述把加进去),共64个因素。

然后对这个64因素几种常见的预测模型,进行LASSO筛选,发现了6个系数不为零,也就是有意义的预测因子。

作者对这6个预测因子,做了多因素COX回归,最终发现4个因子。

最终构建的最优模型如下,共4个因子。

然后构建了4个因子的Nomo图,以及后续的3个度的验证,就不说了!

用法三:

这种用法相对少见,就是直接用LASSOLOGIT或者LASSOCOX进行变量筛选,筛选后,用最小误差解,构建模型,无需在对LASSO筛选得到的多个因子,在进行多因素的Logistic或COX进行分析。

几种常见的预测模型-LASSO回归在临床预测模型中的3种用法!_80楼网赚论坛|80楼网创

精鼎原创,欢迎转发,未经允许,谢绝转载!

———END———
限 时 特 惠:本站每日持续更新海量各大内部创业教程,一年会员只需88元,全站资源免费下载点击查看详情
站 长 微 信:chuangyedemao