首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

读书丨大数据技术

在维克托?迈尔-舍恩伯格及肯尼斯?库克耶编写的《大数据时代:生活、工作与思维的大变革》一书中,大数据是指不用随机分析法(抽样调查)的捷径,而采用所有数据进行分析处理。IBM并提出大数据的4V特点为:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)IBM则又为其加上了一个“V”——Veracity(真实性)。

从大数据的生命周期来看,数据采集技术、数据预处理技术、数据存储技术及数据分析技术,共同组成了大数据生命周期里最核心的技术。

大数据技术应用现状

(1)在互联网搜索领域,Google(谷歌公司)在搜索引擎上所获得的巨大成功,很大程度上是由于采用了先进的大数据管理和处理技术。例如,Google运用大数据技术解决搜索引擎的核心问题,即自动下载尽可能多的网页、建立快速的索引、根据相关性对网页进行公平准确的排序。

(2)在机器翻译领域,20世纪90年代,机器翻译出现了基于统计的翻译方法,即在数据庞大的语料库中统计两个词或者短语对应出现的概率。例如,“reada”后面跟一个“book”的概率大大超过“readaTV”的概率。随着实践,人们发现,建立相应的数据模型并在大数据的基础上训练,大数据技术在机器翻译领域大有所为。随着技术的快速发展,近年又兴起了神经网络翻译方法,而这种翻译方法也依然需要基于对大数据技术的运用。

在零售领域,很早以前,就有大型连锁超市通过数据发现,买尿不湿的人通常也会买啤酒,于是精明的商家就把这两样商品放在同一通道内,以促进销售。两种商品之间的联系是,家庭中的爸爸通常会负责购买孩子所需的尿不湿,同时他们也爱喝啤酒。经过解释,啤酒和尿不湿之间的关联不难理解,但如果没有数据支持,即便有人能够通过思考得出这种结论,也很难从客观上说服他人。这种表面上看起来完全不相关的两种商品之间的深层联系,通过数据可以看得一清二楚。

在商业环境中,只要用正确的方法获取真实的数据,解读这种关系并不困难。事物之间只要存在关联,就可以运用大数据技术进行关联分析,并达到最终目的——让用户尽可能多的看到想购买的商品,甚至是激发潜在的购买需求。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210927A03ANL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
http://www.vxiaotou.com