当前位置:主页 > 查看内容

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

发布时间:2021-05-06 00:00| 位朋友查看

简介:今天早上四年一度的美国大选又如火如荼地开始了 虽然事不关己,但是作为一名合格的吃瓜群众,想必不少人都时不时刷新着美国的大选结果,毕竟猜M国总统可比刷段子有趣多了 一边是人称建国、号称没有人比自己更懂xx的懂王特朗普,另一边是做了几年副总统平平无……

今天早上四年一度的美国大选又如火如荼地开始了

虽然事不关己,但是作为一名合格的吃瓜群众,想必不少人都时不时刷新着美国的大选结果,毕竟猜M国总统可比刷段子有趣多了

一边是人称建国、号称没有人比自己更懂xx的懂王特朗普,另一边是做了几年副总统平平无奇、被怀疑老年痴呆的睡王拜登,这两个人放在一起竞选美国总统就已经足够具有戏剧性了,而让这场大选变得更加有趣的,则是从未迟到的“打脸”与“反转”

大数据与民调

其实早在这场大选开始之前,赌场、民调、经济学家、分析师、大数据公司等就已经开始预测了,而今年的情景,似乎与四年前特朗普大战希拉里颇为相似:

所有的媒体、民调机构和大数据预测结果都显示,2016年大选将毫无疑问地由希拉里胜出,希拉里将成为美国历史上第一位女总统

然而最终的结果却让人大跌眼镜,起初丝毫不被看好的特朗普,竟然一口气拿下6个摇摆州,绝境反击,成功上演丝血反杀的好戏!

而结果就是,大数据系统和民调顿时被骂的狗血喷头,世界的吃瓜群众都表示很受欺骗

恰逢今年,美国经历了黑人运动、新冠疫情、移民风波等等数场混乱不堪的事件

特朗普的支持率因此一路走低,美国著名媒体The Economist甚至预测,大选时拜登的获胜率将超过97%

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

而大数据系统和民调机构也表示,今年的预测算法已经进行了修正,预测结果可靠率将高达80%以上,不会出现上次的乌龙事件

那么今年大选前,民调大数据系统给出的预测结果是什么呢?

拜登将在大选中获胜,成功当选新一届美国总统,特朗普将遭遇滑铁卢

民调大数据的依据似乎也十分科学,各种民调机构将定期对不同地区的民众进行调查,然而结合美国大选的规则、民主共和两党的区域划分、基于往年的大选规律、结合大数据预测算法,最终得出一个较为合理的结果

这么看,似乎民调大数据的结果会是十分合理的

一如既往地打脸

事实上也似乎如此,因为大选开始前,拜登基本上确定已经手握210张选票,距离美国宪法规定的“270张即可获选总统”的规定数额,仅仅差之毫厘

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

而特朗普的情况就悲惨很多了,6个摇摆州中只要有一个没有拿到,就非常有可能败选

而特朗普要想赢,就必须拿下从德克萨斯到宾夕法尼亚的所有摇摆州,难度难以想象

而其中最重要的关键票仓——俄州、德州、宾州、佛州,拜登的民调情况又占优,可以说拜登几乎是具有极大优势的

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

而拜登则只需要赢下宾夕法尼亚就能锁定胜局,这场大选似乎已经提前板上钉钉了

然而,谁也没有料到,今天的美国大选竟然会如此惊心动魄,且富有戏剧性

大选刚刚开始,拜登与特朗普的争夺的确非常激烈,拜登的优势发力很猛,不少摇摆州都开始出现浅蓝,说明拜登的支持率较高

连关键票仓德克萨斯都翻蓝了,估计没人会怀疑民调的准确性了

然而,仅仅一个上午过去了,广大吃瓜群众却发现,那些翻蓝的摇摆州竟然开始变成浅红,最后竟然全都翻红了!

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

特朗普再次在摇摆州中获得了完全的胜利,截止到发文时,特朗普已经基本拿下了摇摆州中的关键选票

虽然拜登明面上还有着12票的优势,但是明眼人都能看出来,后面的票仓中拜登能拿到的选票寥寥无几

得摇摆州者得胜利,这是美国大选规则下不变的真理

这场“闹剧”,十有八九是特朗普以成功者的姿态收场

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

哪怕最终出现了一些不可抗的事件,让拜登以微弱的优势获胜,这次大选也足够让美国的民调大数据系统,脸面尽失了!

大数据没用了吗

连续两次的失误,让民调大数据的可信度迅速低到了令人发指的地步,甚至成了过街老鼠,人人喊打

按理说,美国的民调大数据系统应该是相当科学的,但是为什么会出现这么多乌龙事件呢?

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

其实,很多人都会有一种误解,认为大数据系统的结果真实性,来自于算法与实际情况的高度拟合性和契合性

但我们在做数据分析、数据挖掘或者其他与数据相关的工作时,首先都要保证数据来源的真实性与可靠性

就拿这一次美国大选来说,民调大数据系统所依赖的数据源,是来自于各个州的民调情况,以及该州往年的数据情况,比如哪些州一直都是民主党的票仓,哪些州一直都是共和党的铁杆

但是这种数据源的真实性却十分值得考究:

比如,会不会出现口头上支撑拜登,暗地里却给特朗普投票的情况?

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

当然有,而且这种情况或许非常多,因为特朗普的激进支持者有多烂,大家都懂得

比如,会不会出现幸存者误差的情况?

大数据预测、分析、民调全失误?扒一扒今年的美国大选到底有多扯

当然有,特朗普的支持者中有很大一部分是农民、农场主,分布地区多为偏远的山区等,大数据系统难以保证这个人群在民调当中的有效占比

比如,各州的历史数据会不会产生误差?

当然会,尤其是近几年美国各州之间的移民情况相当频繁,就以德克萨斯州为例,德州一直都是共和党的老窝,然而今年德州票仓的争夺却异常激烈

原因就在于很多人受不了加利福尼亚州的高税环境,有钱人和流浪汉同时涌入了德克萨斯州中,导致了民主党选民的迅速膨胀,这就是历史数据的偏差

当然还有非常多的其他情况会导致数据产生偏差,都是在于数据源的处理上,是否真的具有强说服力,是我们做数据分析中最苦难、也是最重要的工作

这些工作,远远不是那些民调大数据机构改改权重系数就可以解决的,反而让这次的预测更加的离谱

所以,这次的美国大选,打的不光是媒体的脸,更是狠狠打了那些坐吃等死的民调大数据机构的脸,本末倒置,失信于人,自作自受!


本文转载自网络,原文链接:https://www.toutiao.com/a6891181964171149832/
本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!
上一篇:一个数据爬取和分析系统的演变过程 下一篇:没有了

推荐图文


随机推荐