哇,互联网大数据分析师,听起来好高大上哦,其实不然,做的事情都是***层的事情,打杂的,是业务的仆人,为全公司的人服务。
在你的眼里他们待遇好,白领,挣的钱多!
钱是人力堆出来的
在你的眼里他们制作报表,看起来好高大上,很炫酷,很漂亮!
在你的眼里他们是大数据领域的工作者,处于时代的前列,很潮!
数据种类多,量大,变化快
其实他们就是一群搬砖的。
般的是砖,卖的是苦力
他们天天要用hue跑数据,对数据,有时候还会碰到数据倾斜问题,如果没找到原因,会跑一天时间,还没验证数据;
有时候为了验证数据和仓库工程师吵架,有时候是为了取数口径,有时候为了调度,数据为什么还没出来,各种扯皮的事情;
有时候对数据和业务还有运营吵架,有可能是为了需求,有可能是为了口径;
记得一次为了赶公司的kpi报表,公司从大数据平台组,大数据仓库组,大数据分析组和大数据挖掘组都在加班,确保万无一失,他们是这样分工的:
经过一个星期的加班加点,成果终于出来的,然额并没有什么卵用吗,老板不一定认可。
重来,重来,重来,老板说了三遍,我们很尴尬,分析师更尴尬,因为口径都是这里来的。
不仅做的事情有时候得不到认可,而且没有成就感。
在我们团队中,分析组加班是最多的,有时候还要做仓库的事情,有时候还要管调度,验证数据。
有时候写代码的时候还是***兴的,我们用的工具主要是pycharm,hive,sparksql,shell ,网易有数,这个时候犯错了还能改,bug可以修复。
python功能还是很强大的,我们既可以用来做报表,又可以用来发邮件,又可以用来运维,又可以用来挖掘,简直是全能王。
shell是我们部署脚本线上运行的利器。
sparksql基于内存运算的大数据组建,有事给我们验证数据带来方便,我们很是喜欢。
分析工作看起来简单,做起来很难,需要掌握的很多,路漫漫其修远兮,吾将上下而求索。
想进入这个行业的同学做好心里准备,加班多,待遇不一定好,等有了经验可能会好一些。
查看表结构,sbtest1有主键、k_1二级索引、i_c二级索引 CREATE TABLE `sbtest1` ...
很长时间没有更新原创文章了,但是还一直在思考和沉淀当中,后面公众号会更频繁...
一、PostgreSQL行业位置 一 行业位置 首先我们看一看RDS PostgreSQL在整个行业当...
本文转载自网络,原文链接:https://mp.weixin.qq.com/s/vlOUg46B5bcmToX-fjavJQ...
9月17日,2020云栖大会上,阿里云正式发布工业大脑3.0。 阿里云智能资深产品专家...
中国最?好的一朵云飘进了华瑞银行。阿里云将进一步助力华瑞银行All in Cloud。 -...
2020年对于云计算行业来说是突破性的一年,因为公共云供应商增加了收入,而疫情...
在TOP云(zuntop.com)科技租赁过服务器的站长都知道独立服务器在价格上比VPS主...
最近,DevOps的采用导致了企业计算的重大转变。除无服务器计算,动态配置和即付...
定义 this是函数运行时自动生成的内部对象,即调用函数的那个对象。(不一定很准...