今天早上四年一度的美国大选又如火如荼地开始了
虽然事不关己,但是作为一名合格的吃瓜群众,想必不少人都时不时刷新着美国的大选结果,毕竟猜M国总统可比刷段子有趣多了
一边是人称建国、号称没有人比自己更懂xx的懂王特朗普,另一边是做了几年副总统平平无奇、被怀疑老年痴呆的睡王拜登,这两个人放在一起竞选美国总统就已经足够具有戏剧性了,而让这场大选变得更加有趣的,则是从未迟到的“打脸”与“反转”
其实早在这场大选开始之前,赌场、民调、经济学家、分析师、大数据公司等就已经开始预测了,而今年的情景,似乎与四年前特朗普大战希拉里颇为相似:
所有的媒体、民调机构和大数据预测结果都显示,2016年大选将毫无疑问地由希拉里胜出,希拉里将成为美国历史上第一位女总统
然而最终的结果却让人大跌眼镜,起初丝毫不被看好的特朗普,竟然一口气拿下6个摇摆州,绝境反击,成功上演丝血反杀的好戏!
而结果就是,大数据系统和民调顿时被骂的狗血喷头,世界的吃瓜群众都表示很受欺骗
恰逢今年,美国经历了黑人运动、新冠疫情、移民风波等等数场混乱不堪的事件
特朗普的支持率因此一路走低,美国著名媒体The Economist甚至预测,大选时拜登的获胜率将超过97%
而大数据系统和民调机构也表示,今年的预测算法已经进行了修正,预测结果可靠率将高达80%以上,不会出现上次的乌龙事件
那么今年大选前,民调大数据系统给出的预测结果是什么呢?
拜登将在大选中获胜,成功当选新一届美国总统,特朗普将遭遇滑铁卢
民调大数据的依据似乎也十分科学,各种民调机构将定期对不同地区的民众进行调查,然而结合美国大选的规则、民主共和两党的区域划分、基于往年的大选规律、结合大数据预测算法,最终得出一个较为合理的结果
这么看,似乎民调大数据的结果会是十分合理的
事实上也似乎如此,因为大选开始前,拜登基本上确定已经手握210张选票,距离美国宪法规定的“270张即可获选总统”的规定数额,仅仅差之毫厘
而特朗普的情况就悲惨很多了,6个摇摆州中只要有一个没有拿到,就非常有可能败选
而特朗普要想赢,就必须拿下从德克萨斯到宾夕法尼亚的所有摇摆州,难度难以想象
而其中最重要的关键票仓——俄州、德州、宾州、佛州,拜登的民调情况又占优,可以说拜登几乎是具有极大优势的
而拜登则只需要赢下宾夕法尼亚就能锁定胜局,这场大选似乎已经提前板上钉钉了
然而,谁也没有料到,今天的美国大选竟然会如此惊心动魄,且富有戏剧性
大选刚刚开始,拜登与特朗普的争夺的确非常激烈,拜登的优势发力很猛,不少摇摆州都开始出现浅蓝,说明拜登的支持率较高
连关键票仓德克萨斯都翻蓝了,估计没人会怀疑民调的准确性了
然而,仅仅一个上午过去了,广大吃瓜群众却发现,那些翻蓝的摇摆州竟然开始变成浅红,最后竟然全都翻红了!
特朗普再次在摇摆州中获得了完全的胜利,截止到发文时,特朗普已经基本拿下了摇摆州中的关键选票
虽然拜登明面上还有着12票的优势,但是明眼人都能看出来,后面的票仓中拜登能拿到的选票寥寥无几
得摇摆州者得胜利,这是美国大选规则下不变的真理
这场“闹剧”,十有八九是特朗普以成功者的姿态收场
哪怕最终出现了一些不可抗的事件,让拜登以微弱的优势获胜,这次大选也足够让美国的民调大数据系统,脸面尽失了!
连续两次的失误,让民调大数据的可信度迅速低到了令人发指的地步,甚至成了过街老鼠,人人喊打
按理说,美国的民调大数据系统应该是相当科学的,但是为什么会出现这么多乌龙事件呢?
其实,很多人都会有一种误解,认为大数据系统的结果真实性,来自于算法与实际情况的高度拟合性和契合性
但我们在做数据分析、数据挖掘或者其他与数据相关的工作时,首先都要保证数据来源的真实性与可靠性
就拿这一次美国大选来说,民调大数据系统所依赖的数据源,是来自于各个州的民调情况,以及该州往年的数据情况,比如哪些州一直都是民主党的票仓,哪些州一直都是共和党的铁杆
但是这种数据源的真实性却十分值得考究:
比如,会不会出现口头上支撑拜登,暗地里却给特朗普投票的情况?
当然有,而且这种情况或许非常多,因为特朗普的激进支持者有多烂,大家都懂得
比如,会不会出现幸存者误差的情况?
当然有,特朗普的支持者中有很大一部分是农民、农场主,分布地区多为偏远的山区等,大数据系统难以保证这个人群在民调当中的有效占比
比如,各州的历史数据会不会产生误差?
当然会,尤其是近几年美国各州之间的移民情况相当频繁,就以德克萨斯州为例,德州一直都是共和党的老窝,然而今年德州票仓的争夺却异常激烈
原因就在于很多人受不了加利福尼亚州的高税环境,有钱人和流浪汉同时涌入了德克萨斯州中,导致了民主党选民的迅速膨胀,这就是历史数据的偏差
当然还有非常多的其他情况会导致数据产生偏差,都是在于数据源的处理上,是否真的具有强说服力,是我们做数据分析中最苦难、也是最重要的工作
这些工作,远远不是那些民调大数据机构改改权重系数就可以解决的,反而让这次的预测更加的离谱
所以,这次的美国大选,打的不光是媒体的脸,更是狠狠打了那些坐吃等死的民调大数据机构的脸,本末倒置,失信于人,自作自受!
多云将会蓬勃发展,但是它给企业带来了哪些潜在威胁? 冠状病毒疫情如今已经成为...
本文已经过原作者 Taimoor Sattar 授权翻译。 Javascript 是浏览器可以理解的语...
域名 没备案如何建设网站?域名其实也不是一定要备案的,就算是搭 建网站 ,也不...
虚拟主机 什么牌子好?虽然市面上提供虚拟主机的厂商很多,但虚拟主机事关网站运...
本文来源:用户投稿 TOP云 (west.cn)3月11日消息,事儿网络信息技术公司旗下怒...
环境:springboot2.3.9.RELEASE + redis3.2.100 Redis是一种基于客户端-服务端模...
云服务器 的内存多少? 云服务器 的内存不是固定不变的,用户可以根据自己网站规...
嘿,我又来了,今天来上手一波serverless,搭建一下WordPress,看看具体怎么样 p...
医疗机构可以采用大数据技术存储患者的大量信息,有助于研制和开发冠状病毒疫苗...
TOP云 (west.cn)3月25日消息,为解决米友批量续费的高额成本问题,TOP云一直在...