读者QQ群③:168129342,投稿请发dashuju36@qq.com
我要投稿

从0到1构建数据生态系列之二:拓荒

36大数据

文 | blogchong

接上一篇《从0到1构建数据生态系列之一:蛮荒时代》,这篇我们来一起讲讲如何在数据的蛮荒时代来拓荒。

1 你需要和你的BOSS好好谈谈未来

这里我所所说的BOSS,或许是你实打实的老板,当然也或许是你的直属Leader,总之是有权力为公司数据化运营、数据化决策拍板的人。

BOSS知道要做数据这么个事,但是对于细节他肯定是不熟悉的,他只知道最终他需要达到大概什么样的目标,市场有这么个数据化驱动的趋势。

那么,这个时候,在真正动手之前,你需要和他好好聊聊。

首先你需要为你的老板或者说与BOSS一起来拆解公司数据化的目标,你需要彻底清除公司想把数据化做到什么程度,每个阶段大致目标是什么。

虽然,很多中小型公司把一个人当好几个人用,但是,有多少人,做多少事,这句话永远是正确的!只有在彻底的了解清楚大致的战略目标之后,你才能去拆解问题,并且根据实际的预算怎么样分阶段去实现你的数据化目标。

所以,你跟BOSS聊的时候,不是跟他谈你的心目中的数据理想国,也不是他给你描绘宏图大业,而是实打实的了解公司大致往数据投入的人力物力,然后再根据业务目标,去拆解你所需要做的事,按阶段去做详细的规划,去储备你最需要的人才。

2 背起你的锄头,去挖别人的墙角吧

如上,做完那些事,你对于你的数据理想国,至少也是知道他的框架大致组成的。既然你需要架构他,那么,你也一定是知道你缺少什么伙伴,去把它从蓝图中构建出来。

你肯定是需要队友的,任何稍微复杂点的事都不可能独自一人去完成的,能独自完成的事都是小事或者模块化的事,任何一个成系统性的事,都脱离不了团队的协作,一个组合合理,又有共同目标理想的团队是最强大的。

OK,话题不扯远了,回到如何招人的问题上吧。

大数据行业从09、10年开始引入国内,到12年左右生态概念开始火爆,再到现在的如日中天,其实也算发展了好多年了,就算从11年、12年开始算,也算是正式火了四五年了。

正如我在《你们是不是很缺大数据工程师?》一文说到的那样,行业里最多依然是那种真正行业背景不到2年的人,而且很大一部分是“听闻”行情好,纷纷通过某种渠道,例如培训机构培训等转型过来的。

其实这也好理解,大数据真正达到颠覆性的认知,也就在这一两年,是个企业都言必谈数据,这也算是市场需求在驱动着发展。

近一年来,从我手里过面试的人,估摸着也有二十人左右,但实际上真的靠谱的,还真没有几个。

我之所以说这么多,其实是想表达一个意思,通过正规的渠道去招人,其实是很不靠谱的。

那么,有没有其他办法呢?

第一,刷脸。

刷脸这东西,相对比较靠谱,但门槛比较高。

鉴于很早期在大数据线上圈人构建技术交流圈,并且在北京组织过好几次线下的大数据交流活动,或多或少总是认识一些行业内的同行。

于是,我开始与他们挨个联系,看看有哪些有意愿回南方工作的,并且有兴趣与我一同做事的朋友。

其实,很多人或多或少都在线上,甚至是线下都交流过的,我坚信能够跟我玩在一个圈子的人,应该再差也不会比这种随机选人的几率更差吧(哈哈,自恋ing)

所以,初期,我的团队核心几个人,都是我通过线下自己的渠道找来的。

我也是很感激他们能够相信我,其实我是无法保证他们的未来,但我能保证的是与我一起做事会让他们更爽点!

从这点来说,时常与他人多交流是有用的,不单纯是技术上的交流沟通,另一方面也算是自己技术人脉的累积。

对于这一点,我建议从业者有机会多认识业内同行,有机会多交流沟通,就一定不要浪费。

多一个视角,多一份见识,技术需要被交流。多年来,我一直坚持一个理念就是:进步始于交流,收获源于分享!

我也一直在坚持着这个技术分享交流理念,从未动摇过!所以,一般情况下,别人向我请教,只要我有时间我懂得部分,从不吝于告诉别人;当然,遇到自己不懂的问题,自己也不会不好意思去请教他人。

技术人,脸皮要厚!

第二,线上技术圈。

其实归根结底还是需要多参与技术交流,线上很多技术圈子,不管是社区也好,交流群也好,相对很多线上群体来说,相对比较纯粹,毕竟都是搞技术的嘛!

我一直以来都认为,同等基础技术水平下,会主动寻求技术知识沟通交流的人会比那种闭门造成的人优秀,尤其是大数据这个开放而又及其需要自我增长的领域。

人类的聚群现象,能跟你玩在一个技术圈子的人,至少某种程度上来说,也是跟你类似的人。近朱者赤,这句话总是有点道理的(好像有点向自己脸上贴金的意思 哈哈)。

所以,从技术圈子渠道招到的人,相对会比较优质,最起码来说,是相对比较善于解决问题,以及与他人沟通的。

不过如果需要从如上渠道招人,还是需要注意方法的。一方面是注意社群的规则,不要随意践踏,比如发个招聘,一直刷屏之类的,不厌其烦的骚然他人之类的。

作为国内早期的Storm实时领域的技术群(Storm-Hadoop-大数据 191321336)的缔造者(现在应该算是国内Storm技术领域第一群吧,已经辐射到整个大数据领域技术交流探讨),这三年多来,上面这种情况可是见多了。

但作为技术出身的人,一般有需要在群里发对口招聘需求的,只要大概的过一遍JD,一般我都不会阻拦的,毕竟还是有供应需求的,只要不要刷屏骚扰他人就OK。

我想,其他类似的技术圈子都差不多吧。

所以,技术社群招聘渠道,可以试一试,但是需要注意方法。

PS:对了,关于企业要不要招人,招什么样的人,可以参考之前写的一篇文章《你们是不是很缺大数据工程师?》,希望能够帮助到有大数据领域需求岗位的HR或者技术leader们。

3 规划要大,起点要低,阶段目标明确

第一,之所以说规划要大,不是说你的规划设计要超越什么BAT大公司的架构规划,而是说,你在做构架设计的时候,一定需要考虑将来可能有的扩展,为你的整体系统架构留出足够的可扩展性,而不是到了时候又得推翻重做。

如果是这样,那么,你这个兼职架构师就可以换人了。

第二,之所以说起点要低,阶段目标要明确,是因为,只要不是土豪老板,都不可能说上来就给你配备100%的人力,马上去把你的蓝图架构出来的。

投入与产出比,这是所有的决策者都需要考虑的事情。

所以,你需要把你的架构实现去做拆解,拆解成在有限的人力情况下,能够快速形成阶段性产出的目标。

然后逐渐完善你的架构,在适当的时候,再逐渐根据工作进度增加你的人力情况,这才是一种合理的人力规划以及整体发展方向。

4 从基础开始,搭建你的数据帝国

这里先分享一张通用的数据平台架构:

36大数据

在互联网行业,这种数据架构基本都是通用的,区别在于具体实现的细节,以及侧重点的有所不同,互联网行业技术无边界。

我们可以看到,这张架构图相对来说是一个比较完整通用性的数据平台架构,但是其包含的内容信息真的不少,数据从底层逐渐向应用层流转,实现一整套基础数据收集到数据价值挖掘的过程。

整个过程信息量有点大,就不在这个章节细说了,这个章节描述的只是一个整体拓荒的流程,下一节,我们将好好的梳理一下这个架构图,拆解这个架构图,并细说如何拆分阶段目标,最终把这个架构蓝图给绘制出来。

所以,下一个章节,将可能会偏重纯技术一些,但绝对是一个完整的架构体系说明,下一篇《从0到1构建数据生态之三:架构图》再见!

作者简介:黄崇远,花名博客虫(公号“数据虫巢”ID:blogchong),毕业于哈工大,5年的大数据行业经验 ,目前于深圳一创业公司任职大数据主管,数据虫巢公号以及数据虫巢工作室(www.mite8.com)创建者。本文由 黄崇远 投稿至36大数据,并经由36大数据编辑发布,转载必须获得原作者和36大数据许可。

End.

转载请注明来自36大数据(36dsj.com):36大数据 » 从0到1构建数据生态系列之二:拓荒

36大数据   除非特别注明,本站所有文章均不代表本站观点。报道中出现的商标属于其合法持有人。请遵守理性,宽容,换位思考的原则。