一个优秀的大数据开发工程师的日常是怎么样的?
能搞定各种需求就是优秀。
普通大数据开发日常无非是这样的:
早晨起来,拥抱太阳,满满的正能量!
清晨刚出门,收到运维报警短信,昨天的数据没跑出来,愉快的一天就这样开始啦。
来到工位,坐在电脑旁,放下手中的煎饼/星巴克/麦当劳等早餐(公司早餐吃腻了),开始研究补救措施。
终于搞定了,看看邮件。
今天来了10个新需求,还要开2个会,JIRA上有几个模块需要跟进一下。
需求分析师/产品经理/项目经理/咨询顾问又开新脑洞了,提了5个无法实现的需求,脑补偷偷给他报名了下一期奇葩说。
懒得吵架挡需求,回工位写程序。
开源社区又出新框架了,学习一个。
中午食堂吃个饭,陪同事遛弯儿的时候可以聊聊股票和路边的新车。
睡醒了去开个会,回来还有1小时下班。
实时处理程序改了改,日志数据终于正常了。
一看下班为时已晚,和同时去食堂吃一顿,回来再研究下风控模型和年度账单。
地铁人少了,撤退。
到家了,文艺时间,后悔入错行。
明天就周五了,和女朋友计划一下周末去哪里玩儿。
手机响了,调度程序出问题了,穿上拖鞋,打开Thinkpad,远程服务器!
该睡觉了,明天又是美好的一天。
you are in the infinity loop
----------《EVER 17》
一个优秀的数据工程师的日常绝对是跟数据有着密切的联系的,每天早上先对昨天自己的这个行业有了什么新的进展进行一定的了解,然后做出自己今天的工作计划,完成自己的工作,同时要对于自己完成的工作进行一定程度额优化和反思,为将来的发展做铺垫。大数据开发工程师,看起来很高仿。但很多时候都是脱离不了开发的层面,基本上大部分人都是api的调用者。除了少部分人是为了大数据开发的底层服务。
那么,作为优秀的大数据开发工程师是怎么样的体验呢,可以先聊聊技术方面的。
1、你需要有扎实的计算机理论基础,对数据结构以及算法有较强的功底。
2、熟悉Hadoop/Spark/Hive/Hbase/Flink 等大数据工具
3、精通SQL,熟悉常用的关系型数据库、非关系型数据库和数据仓库,具有SQL性能优化经验;
4、熟悉分布式相关系统开发的工作。
5、学习能力强,喜欢研究开源新技术。
6、保持好奇心,学会跟踪现在的技术流行度。说不定你现在弄的数据仓库,在几年后已经跟不上潮流。
在说完技术后,可以看下一下日常的工作流程方面。
1、在如何的有效利用数据前,我们通常需要的是如何先搭建好一个仓库。该数据仓库具有可拓展性,接入性强。
2、其次学会如何去解决问题。针对数据的问题,有时会出现最后产生的报表数据对不上,因为一份最终的数据往往来源于很多原始数据,中间又经过n多处理。要求你对数据敏感,并把握问题的本质,追根溯源,在尽可能的时间里解决问题。
3、最后数据的问题都是你的问题,在数据入库到数据落地使用的过程中,需要处理好有问题的数据,以及需要筛选有用的数据。
讲述完一堆繁琐的理论,那么如何在日常中提升自己呢?
首先确定的是,实践出真知。不多点尝试,如何知道可能会发生的事情,任何的知识构建都离不开实践的积累。
多看市面上的一些工业流程,是什么理论,从哪里入手去做这事,然后基于这种理论能否进行对应的模精品操作。当没有积累的时候,模精品往往是入门的开始。
想要更加全面发展,那么就自己给自己创建对应的条件,从网上下载对应的数据以及如何去应用数据。
如果是小白,那么可以多参加线下沙龙,最后你会发现,来来去去很多都是针对业务逻辑进行相对应的开发。大数据,脱离不开业务基础。
多看点市面上的书,例如美团的大数据,分析他们使用的技术,以及技术上面对应的业务场景。看是否有借鉴作用,如果没有,能否作为知识库的积累,下次遇到相似的案例直接使用。
最后一种日常,大概就是bug往往发生在不经意之间。
关于我们:
AdBright-皓量科技,一站式移动广告技术服务商,致力于构建高效、透明的广告生态系统。AdBright依托大数据挖掘和人工智能学习算法,结合高效的实时竞价算法架构和精准的多维人群画像,为广告主和广告服务商提供专业高效的智能营销决策管理和解决方案
延伸阅读:
2019年必懂的41个程序化广告专业术语
程序化广告生态中的流量接入
浅析程序化广告中的RTB竞价原理
数据如何在程序化广告中发挥作用
程序化广告中的数据应用-oCPM
程序化广告中的数据应用-lookalike
浅析程序化创意原理
程序化广告归因模型知多少