场景化导购通过3D技术把产品形态升级一个维度
署名2021-01-27

场景化导购在现在来看是非常普通的,但在2012、2013年是非常新的方式。随后在内容导购方面尝试新的突破,场景化导购主要以图文、短视频、直播作为导购的载体。随着3D技术日渐成熟,3D自动理解、自动创作和渲染技术可以进一步把物理世界和虚拟世界结合起来,形成新的用户场景。我们开发了一个新的导购产品——躺平,大家可以在淘宝的搜索框搜索「躺平」,来体验3D场景化导购的初步效果。  

一、3D场景生成  

场景化导购通过3D技术把产品形态升级一个维度,极有可能发展新的商业机会。让我们重新回到导购场景。在传统的线下场景,顾客通过导购员的介绍,看到橱窗商品,会产生买欲望。与之类似,线上用户对线上的商品作为单品感知,相比商场导购的体验要单薄很多。因此我们需要给用户打造一个场景,让用户在场景里去理解这个商品,并推荐更多的相关产品。这样用户的感知会有更丰富的层次。  

比如用户对一个桌子感兴趣,当看到桌上摆放的茶壶等物品,就把用户带入了一个场景中。或许用户也对这些东西感兴趣,对需求不再是单点的激发方式,而是通过网状、多角度的激发方式,激发出用户更多的需求,这就是场景化导购的价值。  

场景化导购能解决什么问题?首先能想到的是尺寸大小和视觉问题。用户总会关心商品的尺寸问题和视觉问题。从尺寸和视觉来看,用户对3D肯定是有需求的。用户购买服装需要尺寸和视觉体验,即使是标准化的东西冰箱、洗衣机也都需要3D来感知商品。  

买什么商品对尺寸有要求?比如我们去买家具可能需要到线下,会去家装商城看颜色、风格、尺寸是否匹配,有味没味道。现在这些在3D里通过虚拟化技术都可以实现,所见即所得。也可以和AR结合,形成更流畅的用户体验。  

从可实现性来说,模拟一个人穿上衣服的感觉是有很大的难度的,电影大制作那种做视频动画,用设计师去画,成本非常高,不可能用这样的成本去支持3D场景化导购项目。我们选择的场景一定是在内容制作方面技术更为成熟的,在落地上是比较可控的,家装行业是一个不错的选择。  

导购最重要的是两个部分,一个性化,二是内容的生产。以抖音为例,它核心的创新之一就是可以让用户以简单的操作去生成高品质的内容。对我们来说,通过机器自动生成海量导购内容,然后用个性化推荐技术形成精准的需求匹配。  

二、3D场景内容优化  

为了生成场景,首先要有一套搭配算法。我们通过算法搭配,结合设计师的知识图谱,把两个东西结合起来,形成高品质的搭配结果。通过搭配专家的支持,结合机器学到的模型,我们就可以在一个大的3D商品模型池中生成内容。用搭配的结果在3D场景背景中布局,布局之后渲染,再把商品的锚点打到上面,用户就可以通过点击这些锚点去购物。生成的3D场景化内容,可以在推荐流或搜索场景中为用户透出。  

按照之前的项目经验,只是站在大数据或从推荐角度来说,搭配是很难做的事情,准确性是一个难以逾越的鸿沟。在更加丰富和庞大的数据中,我们怎么做?虽然我们有用户数据,但用户数据并不是万能的,还需要结合其他数据,才能把搭配做精准。在这个过程中,我们引入了3种主要的数据。  

(1)用户行为:用户买了什么,购买过程中的先后顺序,挑选过程,都可以在应用行为体现。这个数据量很大,缺点是噪声也很大。用户并不会沿着设计的逻辑去购买商品,而是根据实际需求,而实际需求有非常复杂的背景,难以精确建模。  

(2)设计师作品:具有一定艺术价值,通过设计师作品可以提升我们的设计感,而不仅仅是功能设计。设计师数据的缺点是数据量比较小,优点是精度很高,且有美学价值。  

(3)使用公开搭配图片公开数据集,抓一些搭配图片,在图片上提取搭配信息。  

在以上数据的基础上,综合使用可解释性的逻辑和和深度学习技术构建算法。可解释性中很关键的是提取语义标签,包括品类、风格,颜色等。此外在视觉方面提取隐式特征向量,最后用深度学习建模,将形成整个算法方案。  

整体上看,搭配是比较困难的,不仅要相似,还要有一定的区别。什么和什么搭,这里面既要有相似,又要有互补的关系,而互补关系需要引入新的信息视角。有了搭配结果后,进入到下一个步骤——布局。在布局之前要有一个空间把这个东西布上,这个空间需要体现场景的美感和品味,不能把这个搭配布在特别土的地方。这个空间就是背景,描述的是某一种场景,比如开会的会场,生活背景、自然背景等等。  

根据这些搭配的结果,我们去算出这些配件的空间关系,这个关系要有弹性,不能硬碰硬。为了形成更柔韧的布局能力,通过一个概率图组合搭配的逻辑,生成一个关系的概率。算法提供了给卧室、用餐区、厨房等场景的布局能力。布局的关键是舒适度,看到布局结构会不会让人感觉到舒服,要做舒适度分析。舒适度分析需要机器学习技术,我们甚至还引入了GPU去优化它的舒适度分析的结果。  

在3D转换到2D图片方面,我们在构图的时候要选择取景的视角。有正对的视角、侧对的视角,总有更适合场景的视角。再加上一些规则防止选的空间过于深、空旷或拥挤,在视觉上看上去比较舒适,都和我们后面的效果评估有很大关系。  

布局完成以后最后会产出一张2D图片,上图是3D场景直接生成的。最后一步视觉体验的关键——光,可以对比一下,同样的场景,左图是没有自动布光的,右图是通过优化布光的算法,视觉上右边看起来比左边更漂亮一些。建立在海量内容基础上的导购,最终决定一个内容质量的还是用户的行为反馈。生成一个内容,内容经过投放以后,会产生点击率,通过点击率判断用户感不感兴趣,有的专家认为漂亮、很有用,但用户也许会有不同的看法,我们必须依靠用户的反馈来判断这个内容的价值。