OTA

除了让数据平台产品化,还能如何做到数据分析的全民皆兵? | 5月开放日笔记

环球旅讯 2017-05-27 18:28:49

自动化测试?个性化专属后台?搭建数据体系最关键是把数据能力产品化,让每个人都可以参与其中。

随着有效的数据内容逐渐成为高价值的信息资产,数据分析师的岗位变得炙手可热。旅游企业开始意识到数据分析与日俱增的重要性,他们在问:我的企业该怎么获得这些技能?空降一个技术团队?高薪去挖技术牛人?……

而在 最新一期的旅讯开放日活动>> 中,蚂蜂窝旅行网技术总监韩鑫提到,蚂蜂窝有 270 个人在做各种各样的数据分析——当然这其中真正有数据分析师头衔的只有一个人。

如何做到“全民皆兵”?韩鑫分享了他亲历的数据体系搭建之路——作为创业公司,该如何一步步建立数据体系;如何找到数据困境的切入点;如何避开官僚化的坑;又怎么利用自动化测试和搭建专属平台达到“以一敌十”。

演讲者|韩鑫
蚂蜂窝旅行网 技术总监 

不是为了用户画像,也不是为了个性化推荐

为什么要建数据体系?天下武功唯快不破,有些公司比较热衷于用户画像,或者说对话推荐,还有从今年开始特别火的机器学习、人工智能。毫无疑问这些东西很重要,但对于创业公司来讲,这些都只是应用。

真正要做什么?不是为了用户画像,也不是为了个性化推荐,更不是为了人工智能。

到底为了什么?其实就一个字“快”,快意味着效率和少走弯路和及时发现问题,让产品通过数据找到优势和不足,去改进;能够快速在有限人力情况下产生效果,能够去评估接下来将会发生的问题,做未雨绸缪的打算。这些才是数据体系要做的东西。

先从数据团队切入,还是先从数据意识切入

刚开始创业公司“一穷二白”,没有自己专门的数据研发团队;没有团队,就没有办法快速输出数据;无法输出数据就没有办法使用数据,数据意识一时难以得到成长。紧接着会导致数据需求没有提到点子上,或者压根没有需求,就算有发现也没有人可以做,业务都做不完,哪儿有时间做数据?

面对这种恶性循环的困境,切入点在哪里?

建一个数据团队,把研发弄起来先满足大家需求,对于创业公司这是否是一个可行之道?如果不差钱,这个公司倒可以一试,但实际风险和成本非常高。数据团队和机器设备的成本都很高,而且刚进来的数据团队对现有业务不是很清楚,这也会过多地消耗沟通成本,所产生的价值短期内并不能呈现。

有没有更好的办法?有,从数据意识上切入!当企业连团队都没有,报表都出不来,怎么开始培养数据意识?我建议四步走:借外力,凝基因,立项目,建团队。充分借助外力,不用我们自己从头开始搭建底层基础设施,也不用组建技术的数据团队,能直接把数据先用起来。

也许这样不能保证所有的数据需求都可以满足,但是先用起来是最关键的。在使用当中慢慢产生数据的意识,慢慢形成自己公司的数据基因;在这个过程当中开始提出一些到位的数据需求,建立临时的数据项目,再慢慢发展变成独立的数据团队。所以,这是一个风险比较低,而且容易一步一步往下演变的方式。

数据驱动得是全公司所有人的事

有了数据团队,紧接着会面临一个问题——数据团队的官僚化。我们经常看到一个典型的结构或者流程是:产品、运营小伙伴提出需求,找数据团队去碰。在这个过程中,数据团队要了解需求,了解如何跟业务对接;然后沟通确定整个技术方案,确定时间再开始做——开发、测试、上线,还有后期的维护。

这是一个非常传统和典型的方式。这样的方式注定会导致——官僚化。因为它是一个非常中心化的、中央集权的数据团队控制所有需求:先做什么、后做什么,控制排期,控制所有的数据研发资源,控制最终成果的产出等等。 

官僚化不是指团队官僚化,而是这种流程官僚化。我相信很多人一定会有同感:为什么我的需求一个月后排期,别人的需求一个星期之后就开始排期,是不是对我们不重视?我一个月之后要上一个活动,排期排到两三个月之后,我等你做出来我的需求都没有了,还做什么?或者是,做一个项目数据团队要两三个月,但是我的目标是 1 个月内完成,怎么办?拉团队里两个人去学大数据相关技术,自己去弄吧。以上这些例子,都是非常典型的现象。

这种官僚化如何去解决呢?

首先,要明确数据驱动不是数据团队驱动。有很多人没有想清楚,一旦发现公司数据驱动能力比较弱,立即建一个数据团队把所有数据相关的事都包揽——控制了所有的资源,所有的排期,所有的输出——这注定了官僚化。

实际上,数据驱动是全公司所有人的事。我们可以去建立公司内部的数据平台,让所有的小伙伴:分析师、产品、运营、编辑、客服,以及业务线的研发都可以在数据平台上工作。一定要让他们有能力自己产生结果,这样一来,遇到需求他们可以自己去优先解决,而不用排队等着数据团队资源。

数据团队同时有数据咨询的角色,这是一种分布式的思路;像现在行业大多都是按小团队快速迭代,而不是按照职能划分。一个小团队有产品、技术、设计,开干后能够快速迭代自己的数据需求。

但这里要注意一点,数据团队不是把资源放手,让每个人去学各种数据技术。到底怎么放?放的是数据和能力,要把数据能力封装起来,对外可以让其他小伙伴使用,他们只需了解基本概念就可以了。

输出数据的关键能力,让每个小伙伴都能折腾

数据建设有哪些关键的点?我总结为:原料、消化和成果。这三块要变成能力输出出去,让每个小伙伴都能折腾。

比如原料,很重要的就是数量能力和种类能力。如果作为某一个产品线的小团队,需要上报数据,每天几百万上千的数据,上报全新的数据需要多久?在蚂蜂窝,需要十几分钟。相比之下,有的公司因为没有把这个能力封装出去,报一个新的数据结构得反复确认,可能花一两周时间才可以。

至于数据处理,包括实时可以做什么、算什么,离线算什么,效果如何等。另外,还要有管理的能力,包括原数据的管理,运算处理的规则和运算服务的管理,权限的管理。真正把数据管起来才能把充分组织起来,而不是一团乱。这之后还要洞察,最典型的观察是数据可视化。

数据算好,但不能高效的使用,那数据就是躺在机器上的一堆数字而已,并不产生价值。

所以接下来就是成果。怎么把数据应用到每一个小伙伴日常工作分析当中?如何快速的去应用到线上的产品当中去?其中一个特别关键的点,就是质量。创业公司常见的数据质量问题,就是因为产品迭代所产生的,这几乎无法避免。怎么解决?

对于产品和迭代产生的问题,做自动化测试。把上报标准定死了,一旦产品迭代之后,如果有错误直接一跑发现报错了,代表就有问题了,这个版本立马修,没有等上线就把错误杜绝了。在错误数据上线之前杜绝掉,从根本上解决掉产品迭代所来的数据质量问题。从成本来讲,自动化测试不需要多,很多创业公司甚至一两个测试就可以搞定,往往比雇数据开发工程师去做数据开发报警等等成本要小得多。

以一敌十的个性化专属后台

如何做到以一敌十。我直接举例子,蚂蜂窝一个无线产品经理在一两年前,用了两天时间,自己做了一个 App 无线部的数据后台。里面涉及十几个一级频道的分析,右边是二级频道,三级频道,每个节点都是数据报表,涉及十几张数据报表,90% 的数据报表都在这两天里面直接搞定了,而且没有用一个研发人员,自己搞定了。

以前做这样的后台沟通需求都要至少两天,包括到底要什么报表,字段到底怎么弄,逻辑怎么算等等。而且之前我们要排期,一个月之后活动要两三个月之后才开始做,导致活动结束了,数据都看不到。

而现在每一个部门,每一个团队,每一个人都可以建立自己专属的数据后台,甚至为几天、一周的活动做一个数据后台都可以。因为可能花半天时间就能直接使用,活动结束就可以抛弃掉。

第二个案例,关于实时统计。右边的界面是:打开蚂蜂窝,当前有多少人正在旅行,旅行的用户中都在关注什么——哪些美食、哪些景点和购物场所,并且有实时更新。像这样的实时统计我们只需要 5 分钟可以搞定,不需要写代码。

第三个例子,这是一个典型的数据查询后台,一堆参数变量。以前很多公司要开发具体需求来做报道系统。而蚂蜂窝的后台不需要研发人员介入, 5 分钟之内就可以把查询变成一个后台,可以分发给所有相关小伙伴,其实这个后台还可以直接做 API,不需要写代码也可以做数据查询 API,可以获取所有结果做相应的个性化推送。

搭建数据体系最关键是把数据处理能力、原料消化能力和最终上线产生的成果输出能力产品化,让每个人都可以参与其中。不断使用数据,不断做各种符合业务需求的数据产品,形成良好的循环,最终达到——让数据融入每个人的血液,每个人有权利接触到数据、使用数据、创造数据,把数据应用到工作的每一天,每一个产品运营的活动上去。


*本文节选自本周三在上海举办的旅讯开放日,点击查看视频回顾>>

想参加我们的活动?

接下来我们将于 6 月 22 日(周四)在 杭州 举办以收益管理为主题的开放日活动,立即报名>>

© 以商业目的使用环球旅讯拥有版权的内容,请遵循环球旅讯 版权声明 获得授权。非商业目的使用,请遵循 CC BY-NC 4.0

评论

未登录

去登录

游客

2017-07-04

0
回复

这个有点牛逼

客服二维码

想获取更多内容或线索?

扫码添加学委,帮你支招!

分享
微信
微博
QQ
收藏
评论
点赞
客服
添加专属客服
客服二维码

您好,我是您的人工客服!点击联系客服

顶部
微信扫码分享
打开微信扫一扫

微信扫码参与话题讨论