3D场景化导购算法如何实现？3D实景逛街发布

署名2021-01-06

3D场景化导购算法如何实现的？此篇就来详细了解一下。5月28日，天猫618宣布开启3D购物时代，首次将3D购物技术大规模应用于宜家等100个商业体，我们可以在手机上逛商场，就像自己亲自到了商场一样。

5G投入商用后，3D购物成为最受科技界期待的新技术之一。作为618的绝对主场，天猫618每年推出新技术，不断拓展商业边界，同时让消费场景不断拓宽。

此前，受疫情影响，不少线下客户并没有恢复，实体商业非常关注如何通过新技术实现商品的在线化。3D购物背后的实景技术就非常强大了，能够将购物体验从平面陈列式升维为立体场景，这也是电商未来发展的主流方向。

下面我们就分享一下有关3D 场景化导购算法的内容，这里以淘系的躺平产品为例

躺平是淘宝发布的覆盖大家居行业生产供给、设计生态、设计师工具、场景化导购平台，它是随着 3D 技术逐渐成熟，3D 自动理解、自动创作和渲染技术的进步，形成新的用户场景下的产品。

场景化导购

让我们先回到真实导购场景中，拍一些图片，在上面编辑文字，或者录制一些视频，这些更接近数字世界通常的做法。

文字是一维的，图片是二维的，视频增加了时间维。而 3D 是三维的，和我们生活的物理世界更加一致。

3D场景生成

通过 3D 技术把产品形态升级一个维度，极有可能发展新的商业机会。让我们重新回到导购场景。在传统的线下场景，顾客通过导购员的介绍，看到货架上的商品，会产生购买欲。与之相似，线上用户对线上的商品作为单品感知，相比商场导购的体验要单薄很多。因此我们需要给用户打造一个场景，让用户在场景里去理解这个商品，并推荐更多的相关产品。这样用户的感知会有更丰富的层次。

比如用户对一个桌子感兴趣，当看到桌上摆放的茶壶等物品，就把用户带入了一个场景中。或许用户也对这些东西感兴趣，对需求不再是单点的激发方式，而是通过网状、多角度的激发方式，激发出用户更多的需求，这就是导购的价值。

在导购中，3D 能解决什么问题？首先能想到的是尺寸大小和视觉问题。用户总会关心商品的尺寸问题和视觉问题。从尺寸和视觉来看，用户对 3D 肯定是有需求的。用户购买服装需要尺寸和视觉体验，即使是标准化的东西冰箱、洗衣机也都需要 3D 来感知商品。买什么商品对尺寸有要求？比如我们去买家具可能需要到线下，会去家装商城看颜色、风格、尺寸是否匹配，有味没味道。

现在这些在 3D 里通过虚拟化技术都可以实现，所见即所得。也可以和 AR 结合，形成更流畅的用户体验。从可实现性来说，模拟一个人穿上衣服的感觉是有很大的难度的，电影大制作那种做视频动画，用设计师去画，成本非常高，不可能用这样的成本去支持 3D 导购项目。

我们选择的场景一定是在内容制作方面技术更为成熟的，在落地上是比较可控的，家装行业是一个不错的选择。导购最重要的是两个部分，一个性化，二是内容的生产。

3D场景内容优化

为了生成场景，首先要有一套搭配算法。我们通过算法搭配，结合设计师的知识图谱，把两个东西结合起来，形成高品质的搭配结果。

设计师的专业输入怎样在算法中流畅丰富地表达？是其中一个很值得研究的问题。通过搭配专家的支持，结合机器学到的模型，我们就可以在一个大的3D商品模型池中生成内容。用搭配的结果在3D场景背景中布局，布局之后渲染，再把商品的锚点打到上面，用户就可以通过点击这些锚点去购物。

生成的3D场景化内容，可以在推荐流或搜索场景中为用户透出。按照之前的项目经验，只是站在大数据或从推荐角度来说，搭配是很难做的事情，准确性是一个难以逾越的鸿沟。在更加丰富和庞大的数据中，我们怎么做？

虽然我们有用户数据，但用户数据并不是万能的，还需要结合其他数据，才能把搭配做精准。在这个过程中，我们引入了 3 种主要的数据。

第一是用户行为：用户买了什么，购买过程中的先后顺序，挑选过程，都可以在应用行为体现。这个数据量很大，缺点是噪声也很大。用户并不会沿着设计的逻辑去购买商品，而是根据实际需求，而实际需求有非常复杂的背景，难以精确建模。

第二是设计师作品：具有一定艺术价值，通过设计师作品可以提升我们的设计感，而不仅仅是功能设计。设计师数据的缺点是数据量比较小，优点是精度很高，且有美学价值。

第三是使用公开搭配图片公开数据集，抓一些搭配图片，在图片上提取搭配信息。在以上数据的基础上，综合使用可解释性的逻辑和和深度学习技术构建算法。可解释性中很关键的是提取语义标签，包括品类、风格，颜色等。此外在视觉方面提取隐式特征向量，最后用深度学习建模，将形成整个算法方案。风格非常重要。大家平时看到的很多现代、简约风，但在整个家居市场中有很多风格，风格彼此之间是不能乱搭配的，比如把美式和欧式、简约搭配在一起是不可以的。为了精准地提取风格，需要有一套方法，从零到一，没人告诉我们家居是什么风格的，要把这个体系建起来。用数据结合算法、人工输入，逐渐丰富标签体系。甚至必要的情况下还会扩充一些细化的标签，这里会有人和机器结合的循环过程。

以上图为例，看上去像柜子一样的这件家具，有很多表示风格的元素，但这个元素必须要由机器学习的方法抓出来，这里有很多细节上的工作。

直接在 3D 上提取风格非常复杂，而 2D 图像积累了很多成熟的技术。先把 3D 模型从不同视角渲染成图片，预测这个图所表示出来的到底是什么风格。然而风格在细微之处，并不仅仅在一个整体上，也就是整体不能完全反映出商品的风格。在细微之处需要引入 Attention 机制。

我们可以观察这这些 Attention 出现在能表明商品风格的地方，比如说这个家居底下的腿型，还有顶部的装饰，这些最能反映它的风格。相应的，我们通过多个 Attention 部分匹配的方式建立出对应的网络。

为什么一定要用多个部分的风格特征来匹配，而不采用一个部分来匹配？在很多部分上分别进行匹配，统计上彼此校验增强，才能提取出准确的风格标签。

有了这个风格之后，最后生成搭配。这是一个类似于推荐技术的过程，先粗选再细选。搭配是一个迭代的过程，

最后的话

3D 和机器学习结合是比较新的话题， 3D 场景生成、 3D 搭配推荐、机器学习、深度学习这些模块已经都涉及到了。

顺带指出，3D 建模是非常关键的，它是第一环。在这上面的 3D 搭配紧随其后。目前3D 搜索还没有涉及， AR、VR、MR 也有想象空间。这些工业界急需要解决的问题，也给科研工作提供了很多有启发价值的广阔场景。