面向移动互联网时代的智能运营体系搭建
署名2021-01-28

本文根据2018年云栖大会杭州站移动研发平台EMAS专场上,阿里巴巴资深技术专家元绰的演讲整理成文,介绍面向移动互联网时代的智能运营体系搭建,主要分成三块内容:第一,智能运营的使命和典型应用场景;第二,个性化推荐系统的架构;第三,AB在智能运营系统中的应用。  

每个企业都有许多的数据,但能否将数据转化成商业价值,是企业非常关心的问题。阿里巴巴曾自嘲是一家坐在数据的金矿上啃着馒头的企业,前几年集团积累了很多的数据,但这些数据并没有真正应用起来,受限于几个原因,比如大数据的技术框架还不成熟,运营团队对数据应用的意识还不是很强,但今天,数据在阿里巴巴的应用范围已经越来越广泛。  

一、智能运营的使命  

衡量一个智能运营系统做得好不好,目标非常明确,就是看能不能帮企业实现数据的增长,因为增长是企业最核心的诉求。  

要实现企业智能运营,首先要进行数据运营闭环的建设。传统的BI,收集数据,给老板产出报表,让老板做决策,但智能运营系统,最重要的是把数据应用到实际业务场景中,形成数据闭环。收集数据,通过模型的训练转换成系统的预测能力,运用到实际业务场景中,最后把用户的使用数据反馈给我们的系统。经过几轮迭代,整个系统的预测能力会越来越强。  

企业希望提升业务结果,业务结果的提升依赖于平台上的用户对我们的认可。EMAS的业务统计模块可以承担数据采集的工作,了解了用户的行为,机器智能的作用就在于将用户的行为数据转换为企业的运营行动。  

具体的流程可以分成这么几个部分:首先基于原始数据,以新客为例,根据用户对冷启动阶段的热门数据的点击情况,对用户进行第一次打标,我们大体识别该用户属于什么样的类型;其次,我们做尝试性推送,比如资讯或者产品,用户根据我所推送的资讯或者产品,会有相应的点击行为,经过几次交互,机器对该用户的理解会加深。最后,经过用户跟平台的多次互动后,企业配合相应的运营策略,比如促销,转化效果就会有比较明显的提升,这是智能运营系统的基本流程。  

我们对用户的全生命周期理解,是从新客到老客以及老客帮你做传播这一整个阶段,时间周期还是比较长的。针对一个新用户,你直接把希望他下单的信息推送给他,效果往往不会特别好。所以必须要对用户整个生命阶段做一些细致的分析。  

二、智能运营的三个典型的应用场景  

(1)精准营销。

营销活动前,分析所面向的人群,具体的定价策略,以及在这样的定价策略下的销量预测,这样企业就可以预先知道KPI的完成情况。  

(2)智能选品。

前面讲的更多的是,产品如何更多与用户进行互动,智能选品适用的场景是我们对目标客群有认知,希望触达我们原来没有触达到的那批用户。超市希望吸引年轻人,就需要调整货品结构,把年轻用户吸引回来。盒马、淘宝心选,是阿里做的比较好的案例。  

(3)千人千面。

淘系在PC时代也做过推荐相关的工作,但效果不好。但到了无线时代之后,个性化推荐的效果就提升明显,源于用户行为发生了很大的变化。无目的性,碎片化,随时随地。我们能否将用户给我们的碎花片时间充分利用好,让我们的消费者一下子对我们的产品感兴趣,需要企业对用户要有非常深的理解和洞察。  

三、个性化推荐系统架构  

接下来,给大家介绍一下个性化推荐系统。个性化推荐在阿里巴巴集团这几年有很多的沉淀。以手机淘宝首页为例,很多地方都做了个性化,比如入口图,每个APP都有子频道,子频道的入口图大部分用的是设计师做的静态图,如果用子频道的数据跟用户做个性化匹配,做千人千面的入口图,入口点击的转化会有很大的提升。好的个性化推荐需要有哪些注意点:  

(1)时间和空间。  

拿电商来说,羽绒服或者衣服都有季节属性,羽绒服适合冬天穿,电子产品有新老款,判断一个用户从来都只买新款,你就应该把新款推荐给他。另外,推送有时间衰减效应,不能一直推相同的货品。时间和空间是必须考虑的两个维度。  

(2)发现性。  

大家在做个性化推荐的时候,模型基本上都是以一个具体的目标来做优化,但这里会有一个什么问题呢?会产生很严重的马太效应:第一,我的推荐依赖于我的历史数据。第二,推什么样的产品转化率最高?肯定是爆款,不管是金融行业还是其他的行业,爆款转化率最高,模型判断推爆款的转化比一般产品的转化要更高,导致什么结果?系统推荐的产品范围也越来越窄,这是很严重的问题。就是说给用户推荐的品类越来越窄,产品范围越来越窄。所以在整个模型过程中,去尝试推荐一些他可能原来历史记录里面不存在的东西,去做一些尝试性的发现,这是非常有意义的,否则对短期收益有好处,但是对长期收益有影响。所以转化率很重要,但是发现性更重要,品类拓宽会让你的业务体量越来越大,产品也一样,爆款之后肯定有新品,新品也需要变成爆款。  

(3)工程实现。  

个性化推荐,传统的实现方法,是截止某一个时间点给用户计算一个推荐列表,每天把这个数据刷新一遍。这样做的问题是什么?用户的数据量一直在增长,相应的存储成本也会随之增长,企业投入成本会很大。所以系统设计的时候需要考虑借助标签的能力。另外,每个人对标签对应的货品排序应该不一样,我们要增加二次排序,要保证每一个人的推荐列表虽然货品一样,但是顺序有差异。  

(4)实时推荐。  

离线推荐主要是基于历史数据,实时推荐是基于当天的数据,当天给用户做推荐,转化率往往最高。但是对我们的挑战是什么?第一,必须有实时计算的能力,因为用户给我们的时间非常少,如果你延迟五分钟,基本上用户就流失了。第二,从算法角度来讲,必须要做一个平衡,你是基于历史推荐数据,还是当天的实时数据,到底哪个转换率最高,要做一个平衡。  

(5)脏数据。  

脏数据一般分两类,第一类是无效数据,比如说“双十一”,因为当天他们的行为非常特殊。“双十一”当天买了你平时可能不会买的东西。这样的数据对日常推荐并没有太大的帮助,这些数据必须要剔掉。第二类数据是作弊数据。像刷信用、刷积分的数据量往往很大,这样的数据如果不剔除掉,最终预测的结果和你原来的真实值之间的偏差会非常大。  

四、AB在智能运营中的应用  

最后给大家讲一下AB测试在智能运营中的应用。大家也知道今天算法的发展非常快,像前几年深度学习很火,这几年强化学习,一些新的算法发展很快,我们在模型迭代过程中需要应用新的算法。但一般来讲,我们不一定能确认哪个算法的效果更好,我今天在线下做非常多的评测,但最后还是要到生产环境去做实验。我们可以做分桶测试,基准桶和测试桶,测试桶我们用一个模型,基准桶用另一个模型,比较两个模型的效果。实际在应用过程中,我们在做AB测试前,必须要做AA测试,保证在实验之前两个桶的数据是一模一样的,这个时候你再把一个桶的模型换掉,数据是可信的。