文章 代码库
个人思考 · · 4 分钟阅读

谷歌的蓝色、数据和选择的艺术|Ocean随笔


谷歌的蓝色是业务的实践,更是人生的哲学和艺术

曾经接触协作过一个数据开发工程师,在工作了一段时间之后,他选择了离职。当问及原因的时候,一方面是薪资待遇问题,另一方面是作为一个数据开发工程师,其价值体现在两个维度,一是数据量有多大可用作清洗和分析,二是自己的数据分析是否能影响业务,或者是业务的决策流程是否从他这里进行。如果只是数据的清洗和分析,那就只是一个无情的数据报表机器人。 数据量决定的是什么,让我们回到一个业务案例。 对于一个新的产品和团队,在数据分析上的颗粒度一般来讲会限制在单个活动的效果(参与人数,曝光,人群的画像,留存)等经典的数据分析方法,基于此去影响下一步的业务决策。特别是在电商场景中,流量,转化率,客单价是影响团队生存和业务利润率最大的因素。 在这个场景下,数据工程师会分为两种场景,一种是来自平台方的业务团队,比如淘宝的卖家。他们会将来自平台方卖家的数据做下载,或者使用API的方式将数据扩充到自己的数据库,因此从卖家的角度便可从多个维度去研究不同的业务策略下的数据。另一种是平台方的数据工程师,在国内电商平台已经实现了一超多强的局面,留存的大的平台方数据工程师主要是服务于电商看板的中台系统建设。特别是在广告投流的场景下,需要有合理的数据结构开放给卖家(毕竟大卖家花费了真金白银去在平台方内投放广告)。 但是如果数据量有更大的扩充,以及更细分维度的扩充,以及可行的用户测试,比如谷歌著名的蓝色测试。

谷歌为了测试用户在访问浏览器时,看到哪一个蓝色会更愿意下单购买物品,针对这种需求,单独对蓝色进行AB测试,在50多种蓝色的测试中,也包括了多种受欢迎的消费场景。最终通过相对复杂的测试,优化了转化率,从而实现几亿美金的归因利润提升。而谷歌能做到单独就蓝色的用户偏好做测试优化的原因是因为每天有亿为单位的用户访问谷歌,广告平台例如淘宝和京东能建设完善的广告后台的原因也跟商家数量以及成交的GMV有关,因此形成了规模效益带来的边际成本递减,以及效益提升。 因此从谷歌的蓝色,到广告平台方的数据工程师,以及业务团队Inhouse的数据人员,同一个数据工程师在不同的场景下,发挥的作用完全不同,这也决定了其价值,而这根本是数据的量级。 如果我们更往大的方向思考,数据量级和场景决定了数据工程师的价值,这进一步影响他们的财务回报和成长速度。那如果往泛类的职业和成长来讲,每一个工种,或者差异性大的个人,在不同的行业和企业中也类似数据工程师那样不同的趋向。 或许谷歌的蓝色讲述的不仅是多次用户测试的选择的最优解,从哲学和人生意义上,讲述的是选择比努力更重要的道理。 同样是一个数据工程师,如果在一个inhouse的电商卖家团队,他的价值只是重复性的清洗电商数据,或者做并不复杂的数据库后台。如果他在阿里京东的数据组,他会经手更大数据量级,在做数据库架构上会思考自己的代码结构是否能跑得更快,运行和维护成本更低,以及如何从卖家希望看到的角度去做思考,因此一种策略产品的思维逻辑便养成。如果在谷歌,特别是早期的谷歌,接触的不仅是蓝色的测试,而是更多在搜索简单的逻辑下细分的高难度的数据研究。 我一直觉得最简单的产品和交互是一种Art,一个简单的搜索,谷歌并不是最早做的,但是他的page ranking的算法,以及后续的优化使其成为搜索引擎领域的霸主,也成为万亿美金的企业。或许在简单的产品下,是无数优秀的数据工程师的结晶。


ESC
输入关键词开始搜索