辛普森悖论:同一个数据集得出两个完全相反的证据?

2018-11-04 MedSci MedSci原创

辛普森悖论告诉我们,数据不是绝对客观的。 想象一下,你和你的小伙伴正在努力寻找一个完美的餐厅,以便愉快的享用晚餐。我们清楚这个过程可能会花费数小时去争论,你会找到现代生活的便利之处:在线评论。通过在线评论,你找到了自己的选择,推荐 Carlo's 餐厅的男女用户的比例都高于你的小伙伴选择的 Sophia's 餐厅。然而,正当你准备宣布胜利时,你的小伙伴使用相同的数据得到,由于所有用户中推

辛普森悖论告诉我们,数据不是绝对客观的。 想象一下,你和你的小伙伴正在努力寻找一个完美的餐厅,以便愉快的享用晚餐。我们清楚这个过程可能会花费数小时去争论,你会找到现代生活的便利之处:在线评论。通过在线评论,你找到了自己的选择,推荐 Carlo's 餐厅的男女用户的比例都高于你的小伙伴选择的 Sophia's 餐厅。然而,正当你准备宣布胜利时,你的小伙伴使用相同的数据得到,由于所有用户中推荐选择 Sophia 的百分比较高,因此很明显要选择它。 到底是怎么回事?谁在说谎?是审计网站的计算错误吗?事实上,你和你的小伙伴都是对的,你在不知不觉中进入了辛普森悖论的世界。在辛普森悖论里,餐馆可以同时比竞争对手更好和更差,运动可以降低并增加疾病的风险,同样的数据集可以用来证明两个相反的论点。也许你和你的伴侣应该在晚上讨论这个引人入胜的统计学现象,而不是出去吃饭。 当原本分离的数据被组合起来,之前出现的统计现象会发生逆转,这时辛普森悖论就发生了。在餐厅推荐示例中,就男女的高推荐率确实可以推荐 Carlo's 而不是 Sophia's,且同时所有评价者对 Carlo's 的推荐率较低。在你说这不可能之

作者:MedSci



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. 2018-11-05 一天没事干

    很好的学习机会

    0

相关资讯

OCC2018:2017中国旋磨数据发布!

2018年5月31日~6月3日,在OCC 2018大会上,发布了2017年中国旋磨数据。北京大学人民医院王伟民教授详细介绍了2017年中国不同地区、不同医院等的旋磨数据情况。

数据诚可贵 分析价更高:数据分析将在四大领域颠覆医疗

未经分析的数据是无益的,数据分析技术将在新药研发、精准医疗、全方位医疗服务、医保诈骗四个方面变革医疗行业。

国家药监局:境外开展仿制药研发,数据完整可在中国注册申报

国家药品监督管理局网站7月10日消息,为贯彻落实中共中央办公厅、国务院办公厅《关于深化审评审批制度改革鼓励药品医疗器械创新的意见》,加强对接受药品境外临床试验数据工作的指导和规范,国家药品监督管理局组织制定了《接受药品境外临床试验数据的技术指导原则》(以下简称《指导原则》)。7月10日,该指导原则正式对外发布。《指导原则》对接受境外临床试验数据的适用范围、基本原则、完整性要求、数据提交的技术要求

AI在医疗上的应用到底有无作用 这组数据告诉你

美国市场调研公司ABI研究(ABI Research)近日的一份报告显示,人工智能(Artificial Intelligence, AI)在医疗行业的应用,可帮助整个行业的供应商大幅降低成本。该报告指出,2017年末利用数据训练AI模型进行预测分析的患者监测设备数量为5.3万,到2021年这一数字将达到301万,复合年均增长率(Compound Annual Growth Rate, CAGR

看病换家医院CT要再拍一遍,数据壁垒下暗藏各方“小算盘”

导读手里拎着几张“片子”来去匆匆,托熟人、找专家看病,这是各医院最常见的一幕。然而很多人并不知道,一次CT检查,要拍出数千幅图像,给到患者手里的胶片最多不超过1/10。一旦本院无法确诊,需要再换一家医院就诊,这寥寥几张“片子”不能满足诊疗需求时,又得花费成百上千元重拍。一张胶片折射的是影像共享难题。半月谈记者调研发现,除受制于设备、技术、诊断等因素外,影像共享还面临信息传输“断头路”、各方“

辅助预测患病风险 重庆建设恶性肿瘤大数据平台

重庆正在建设恶性肿瘤大数据平台,依托医疗大数据收集、分析、预测等功能,可以辅助预测患病风险,协助判断疾病走势,还能帮助医生制定个体化治疗方案。