9月19日,火山引擎“V-Tech数据驱动科技峰会”在上海举行。在会上,字节跳动数据平台负责人罗旋表示,数据飞轮的构建,是业务与数据双向驱动发展的过程。
罗旋表示,让数据最大程度被“用起来”,是数据飞轮转起来的核心驱动力。字节跳动认为,数据消费的深度和广度,表征了数据融入业务的程度;业务对数据的使用越频繁,就表示业务对数据更加的依赖。对数据价值越认可,数据飞轮转动起来的可能性才会越大。
业务的发展则驱动数据资产的不断建设和提升。数据资产并不以收了多少数据,建了多少张表,统一了多少数据作为衡量标准,而是要从数据如何被业务消费的角度来判断。
罗旋表示,如果从更定量的角度来看数据消费的程度,有两个指标:
业务上,字节跳动内部已达到80%的员工直接使用数据产品,这意味着字节跳动每天有大量人在用数据驱动的方式工作;另一方面,当数据被繁荣消费的时候,就会产生数据资产化的需求,从而保障数据消费的效率和质量。
在数据资产中,最典型的交付物是数据指标,被管理起来的数据指标,需要覆盖80%的日常分析才算合格。
而当明确了“数据消费是第一驱动力”后,下一个问题就是如何实现。字节跳动的做法是,让数据流融入业务的工作流程中,让数据在工作的流程中更易获取,使用的门槛更低,提高业务对数据的依赖度和信赖度。
如进行直播运营活动,同一场运营活动中,需要监测几十场甚至上百场同时进行的直播。监测者往往需要在不同的产品或者直播间中间反复横跳,从而做汇总分析。这样的模式效率非常低,本来能够当场发现的问题也没有暴露出来,更谈不上及时修改策略。
针对这样的场景,字节跳动就会提供批量诊断的能力,帮助监测者整合所有要监测的直播间,通过智能诊断和自动化提示,展现真实效果与预期之间的差异,并给出针对性的提升建议。这样就使运营的盯盘效率得到倍数级提升。
罗旋提到,除了数据与业务的充分融合之外,新技术的出现也会带来更大的变革。如今年火爆的大模型,就为字节跳动在数据驱动方面提供了新的探索方向——运用全新的AI技术,加速数据飞轮的转动。罗旋表示,在过去几个月,字节内部通过一系列涉及数据全链路环节的探索实践,已取得一定的进展。包括在数据资产管理上,字节跳动探索了AI“找数助手”,能用自然语言问答的方式,来检索包括表、数据集、仪表盘、数据指标、维度、业务知识库等等,并做出拟人化总结。
在数据生产环节,则研发了基于大模型的开发助手,既可以将用户的自然语言描述,自动生成SQL代码,也可以针对现有代码做诊断优化、问题修复,解释与注释等等,减小了编程语言带来的障碍,降低了数据开发的准入门槛。
在数据洞察环节,字节提供了智能的数据分析助手。只要输入自然语言,就可以查询想要的数据、生成表达式,或是由可视化图表组成的仪表盘。而进一步的分析助手则可以打通飞书等办公协同工具,使用户可以通过IM消息订阅+自然对话,做更多的延展分析。
罗旋表示,通过这些方式,字节跳动可以让数据分析更加灵活,更加随时随地的发生。字节跳动内部的这些实践,也都将融合为全新升级的AI助手能力,并通过火山引擎数智平台VeDI,对外给更多企业提供服务。(作者:杨春风)
本文属于原创文章,如若转载,请注明来源:火山引擎罗旋:构建数据飞轮需业务与数据双向驱动发展https://news.zol.com.cn/833/8334677.html