用局部加权回归散点平滑法(LOWESS)观察二维变量之间的关系

2016-08-27 谢益辉 统计之都

二维变量之间的关系研究是很多统计方法的基础,例如回归分析通常会从一元回归讲起,然后再扩展到多元情况。局部加权回归散点平滑法(locally weighted scatterplot smoothing,LOWESS或LOESS)是查看二维变量之间关系的一种有力工具。 LOWESS主要思想是取一定比例的局部数据,在这部分子集中拟合多项式回归曲线,这样我们便可以观察到数据在局部展现出来的规律和趋势;

二维变量之间的关系研究是很多统计方法的基础,例如回归分析通常会从一元回归讲起,然后再扩展到多元情况。局部加权回归散点平滑法(locally weighted scatterplot smoothing,LOWESS或LOESS)是查看二维变量之间关系的一种有力工具。 LOWESS主要思想是取一定比例的局部数据,在这部分子集中拟合多项式回归曲线,这样我们便可以观察到数据在局部展现出来的规律和趋势;而通常的回归分析往往是根据全体数据建模,这样可以描述整体趋势,但现实生活中规律不总是(或者很少是)教科书上告诉我们的一条直线。我们将局部范围从左往右依次推进,最终一条连续的曲线就被计算出来了。显然,曲线的光滑程度与我们选取数据比例有关:比例越少,拟合越不光滑(因为过于看重局部性质),反之越光滑。 本文的数据文件:物种数目与海拔高度(感谢中科院植物所赖江山博士提供数据并授权使用) R程序代码: # 从本站counts.txt文件直接将数据读入R x = read.csv("http://cos.name/wp-content/uploads/2008/11/counts.txt") par(las

作者:谢益辉



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (6)
#插入话题
  1. 2017-04-12 hanchunhee

    以前没有用过。学习了。

    0

  2. 2016-08-29 chg122
  3. 2016-08-28 zibozhouping

    继续努力学习?

    0

  4. 2016-08-27 doctorJiangchao

    继续学习

    0

  5. 2016-08-27 doctorJiangchao

    继续关注

    0

相关资讯

Logistic回归、决策树和支持向量机介绍

分类问题是我们在各个行业的商业业务中遇到的主要问题之一。在本文中,我们将从众多技术中挑选出三种主要技术展开讨论,逻辑回归(Logistic Regression)、决策树(Decision Trees)和支持向量机(Support Vector Machine,SVM)。 上面列出的算法都是用来解决分类问题(SVM和DT也被用于回归,但这不在我们的讨论范围

回归分析中,多重共线性的处理策略方法

在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 造成多重共线性的原因: 1、解

学霸笔记:Logistic回归分析

Logistic回归:实际上属于判别分析,因拥有很差的判别效率而不常用。现在用得最多的是临床研究中的观察性研究。1. 应用范围: ① 适用于流行病学资料的危险因素分析 ② 实验室中药物的剂量-反应关系 ③ 观察性研究结果中混杂控制 ④ 疾病的预后因素分析 2. Logistic回归的分类: ① 按因变量的资料类型

Logistic回归如何校正的RR,而不是OR?

流行病学研究中,有两个非常重要的,衡量暴露与结局的关联指标:OR和RR。OR(Odds Ratio)中文里通常译为比值比,优势比。Odds是一个源于赌博的概念,比如猜色子大小,硬币正反面时 大 v.s.小 , 正 v.s.反 的概率的比值叫Odds, 两个odds之间再取比值叫Odds Ratio。 针对Odds Ratio具体而言,又分暴露比值比,患病比值比,发病比值比。RR(Rate Rat

logistic回归还是log-binomial回归?RR如何正确估计?

当结局发生率较大时,再使用OR来估计RR时会不准确,建议当结局发生率大于10%时,使用log-binomial回归方法替代logistic回归。 Log-binomial 回归模型是广义线性模型的一种特殊类型,由于它很容易得到某一因素率比( rate ratio, RR) 的最大似然估计值,因此,能够作为干预效应评价的选择方法。流行病学暴露于结局的关联性研究中(队列研究),当结局事件发生率较为罕

分层回归分析理论及意义,以及SPSS操作演示

分层回归(hierarchical multiple regression),也称层次回归,其实是对两个或多个回归模型进行比较。我们可以根据两个模型所解释的变异量的差异来比较所建立的两个模型。一个模型解释了越多的变异,则它对数据的拟合就越好。假如在其他条件相等的情况下,一个模型比另一个模型解释了更多的变异,则这个模型是一个更好的模型。两个模型所解释的变异量之间的差异可以用统计显著性来估计和检验