首页
最新动态
科研合作
开源项目
加入我们
大模型元年,万能的淘宝有了万能AI
在刚刚过去的第15个天猫双11里,我们看到,在生成式AI等科技变革和消费行为习惯变迁的时代大背景下,淘宝正在变为新的“AI淘宝”。科技媒体《量子位》专访淘天集团相关的AI技术负责人,一起聊聊大模型和AIGC文生图两大技术路线在淘宝的融合创新,看看AI如何跨越从技术到应用的鸿沟,带来更好的消费体...
淘天业务技术
2023-11-23
第15年双11,技术创新开启 AI 淘宝新起点
天猫双11走到第15个年头,遇上了“变革”与“新生”2个关键词。在生成式AI等科技变革和消费行为习惯变迁的时代大背景下,淘宝正在变为新的“AI淘宝”。在今年的天猫双11,商家和消费者们多了一位“AI助手”。淘宝天猫平台上商家在双11准备期及开卖期,调用AI次数已超过15亿次。与之对应,淘宝问问...
大淘宝技术
2023-11-13
找AI要祝福!它让我用bug去成长 | 1024节日特辑
AIGC这个词可能是今年媒体、投资界最热的词了,AI绘图、AI生成、AI写作......AI到底有多少功能?今天是1024程序员节,我们邀请了6位不同岗位的淘宝工程师,聊了聊他们眼中的未来消费生活,他们眼中的AI技术,听一听这群探路者在时代新科技与新文化氛围下,有哪些新的思考。01 @祥琛祥琛...
淘天业务技术
2023-10-24
2023天猫双11新闻发布会,电商AI时代来了
淘宝天猫本身就是技术创新的结果,在AI时代开启之际,淘天会更坚定地做长期投入。10月20日讯,2023天猫双11发布会在上海举行,淘天集团CEO戴珊在会上表示,实现AI与电商的有机结合,一定能为品牌商家带来万亿级的生意爆发,“我们也期待,今年双11的技术创新,为用户和商家带来新的、巨大的回馈”...
淘天业务技术
2023-10-24
天猫汽车商详页的SSR改造实践
由于汽车业务的特殊性,天猫汽车基于 Rax 多页应用自建了商品详情的 H5 页面。自定义商详承载了众多业务能力和投放场景。随着业务的发展和页面承载内容的增多,开始出现白屏时间太长等体验问题。前端性能优化算是个老生常谈的问题,我们的页面已经做过首屏接口合并、图片懒加载、骨架屏等体验优化,想进一步...
子虫
2023-02-16
公开下载 |《2022技术人的百宝黑皮书》来了!
新年好!岁末年初,温故而知新。2022年,大淘宝技术公众号一共发布了 248 篇内容,在知乎上做了 80 个精彩回答,在头条、百家、掘金、思否、开源中国等内容阵地都有我们努力布道的身影,也收获了来自社区的各项影响力评选肯定,更开心的是,收到了开发者们的点赞与认同。🍻过去一年,我们尝试在分享的...
大淘宝技术
2023-01-09
如何避免写重复代码:善用抽象和组合
通过抽象和组合,我们可以编写出更加简洁、易于理解和稳定的代码;类似于金字塔的建筑过程,我们总是可以在一层抽象之上再叠加一层,从而达到自己的目标。但是在日常的开发工作中,我们如何进行实践呢?本文将以笔者在Akka项目中的一段社区贡献作为引子分享笔者的一点心得。场景通常,为了简化我们对数据流的处理...
虎鸣
2023-01-05
初次接触氛围系统架构,聊聊我这三个月的理解
本文主要介绍了作者对于氛围中心的业务理解。从氛围的概念出发,阐述了氛围系统的必要性,然后展示了配置端的数据写入、调用端的配置读取等氛围系统的架构细节,最后作者提出了一些对于氛围中心未来的想法和思考。概述氛围的概念氛围是能够刺激消费者购买欲望的一类视觉表达。氛围一般与优惠、价格相关,其目的在于烘...
对易
2023-01-04
Monorepo,大型前端项目管理模式实践
阅读本文您将了解到:什么是 monorepo、为什么要 monorepo、如何实践 monorepo。项目管理模式Monorepo 这个词您可能不是首次听说,在当下大型前端项目中基于 monorepo 的解决方案已经深入人心,无论是比如 Google、Facebook,社区内部知名的开源项目 ...
韵楷
2022-12-15
双 11 第 14 年,技术人的新命题是什么?| InfoQ专访淘宝天猫 CTO 若海
每年双 11 开卖的那一刻,千万用户同时在线下单,那个瞬间服务器的压力是平时流量的数百倍,淘宝系统是否能够稳定支撑,是每年所有人关注的热点话题。时至今日,丝般顺滑已经逐渐成为稳态。从今年开始,双 11 带给人的感觉开始变了,在压力面前,阿里呈现出的姿态是弹性和从容。阿里巴巴集团 CTO 程立形...
大淘宝技术
2022-11-28
MapStruct,降低无用代码的神器
在学习《告别BeanUtils,Mapstruct从入门到精通》后,我发觉MapStruct确实是一个提升系统性能,降低无用代码的神器。然而,在实践这篇文章过程中,我遇到了些问题,并由此对MapStruct框架有了更深入的理解,以下将我的学习收获分享给大家。本文与《告别BeanUtils,Ma...
寥天
2022-11-25
第14个天猫双11,技术创新带来消费新体验
“技术和商业是密不可分的,今年是第14届天猫双11,在过去的13年里,伴随着商业的快速发展,天猫淘宝的底层技术基础设施得到了深厚的积累,同时也支撑了云计算的大规模发展。未来,我们将通过持续的技术创新和突破,让商家更好的做生意,让用户享受更好买、好逛、好玩的线上体验。” 淘宝天猫CTO若海说。今...
大淘宝技术
2022-11-12
2022双11大淘宝技术九大技术亮点发布
为了提升双11的消费体验,大淘宝技术一直在追求卓越和创新的道路上踔厉前行。
大淘宝技术
2022-11-11
浅析设计模式3 —— 装饰者模式
大淘宝技术开发工程师玄苏推荐语:本文从装饰者模式的核心思想到与其他设计模式的横向对比,从代码示例到业务实战,向读者娓娓呈现装饰者模式的真貌。深入浅出的JDK源码透析,使用场景的利弊权衡,真的值得一阅!装饰者模式的核心思想是通过创建一个装饰对象(即装饰者),动态扩展目标对象的功能,并且不会改变目...
鎏越
2022-11-09
浅析设计模式2 —— 策略模式
策略模式是一种应用广泛的行为型模式,本文将着眼于策略模式进行学习分享。概述我们在进行软件开发时要想实现可维护、可扩展,就需要尽量复用代码,并且降低代码的耦合度,而设计模式就是一种可以提高代码可复用性、可维护性、可扩展性以及可读性的解决方案。大家熟知的23种设计模式,可以分为创建型模式、结构型模...
鎏越
2022-11-09
浅析设计模式1 —— 工厂模式
本文将着眼于工厂模式,从简单工厂模式、工厂方法模式和抽象工厂模式出发,展开学习和深入探讨。概述我们在进行软件开发时要想实现可维护、可扩展,就需要尽量复用代码,并且降低代码的耦合度,而设计模式就是一种可以提高代码可复用性、可维护性、可扩展性以及可读性的解决方案。大家熟知的23种设计模式,可以分为...
鎏越
2022-11-09
听8位淘宝工程师聊聊他们眼中的元宇宙 | 1024特辑
我们是技术工作者,致力于思考和创新,用代码去解决生活中的问题,为消费者的快乐和幸福而努力。今天是1024程序员节,我们邀请了8位不同岗位的淘宝工程师,聊了聊他们眼中的未来消费生活,他们眼中的元宇宙,听一听这群探路者在时代新科技与新文化氛围下,有哪些新的思考。01 宋五▌工作范围:家居家装行业智...
大淘宝技术
2022-10-24
性能优化之接口优化
本文从客户端的视角,分享客户端如何协同服务端进行接口时间的优化。Compose是什么接口性能优化对于客户端的同学来讲涉及可能不是很多,但是接口的性能对于客户端的体验影响是巨大的;请求失败、loading、无数据这几个关键词跟客户端的同学一提,想必接口优化的意义就不用多说了吧。一个快速而又稳定的...
是也
2022-10-20
淘宝直播零代码弹窗生产方案总结
本文将介绍,淘宝直播前端团队为提升业务触达效率而设计的零代码弹窗动态化方案。业务背景众所周知,产品有三宝:弹窗,红点和引导。在淘宝直播业务里面,每当有功能上新、活动邀约、系统消息、奖励发放等事件发生时,我们通常采用弹窗来及时告知目标用户。可见弹窗是一项极其重要的触达手段,它打通了平台与主播的信...
弈坤
2022-10-14
入职淘宝一年,聊聊我理解的首页&购物车
本篇文章的作者最近参与了淘宝购物车的工作,认为淘宝购物车和首页在体感上有很大区别,没有高屋建瓴地对整个交易体系和首页体系进行分析,只从一位一线开发的角度,写了写自己对购物车、对首页进行开发的感受和思考,欢迎指教讨论。业务域的区别在写首页和购物车的开发和设计之前,不能绕开它们身处的导购和交易这两...
榆西
2022-10-13
如何顺利从学生蜕变成职场人? | 2022校招生心路历程
每个人的一生都在不断切换角色,其中有次很大的变化就是从学生到职场人。本文将带大家走近大淘宝技术2022校招生们,看看初入职场的他们如何实现从学生到职场人的转变。我们邀请了7位不同专业领域的2022校招同学,聊了聊他们在大淘宝技术的成长经历和故事,以及他们对身份转换、职场适应等各类话题的思考。话...
大淘宝技术
2022-10-13
天猫淘宝卡券包演进史
卡券包整体分为PC端以及无线端两大部分,最开始的卡券包是PC版,随着PC向无线化转型的大潮,无线端卡券包也同步产生。业务定位卡券包这个产品是伴随着电商卡券系统的建立同步产生的。顾名思义,卡券包就是用户资产的展示阵地,电商系统中在用的最多用户资产就是优惠券、红包,卡券包就承接了用户查看自己领取的...
介正
2022-09-15
短视频无尽流前端开发指南
本文基于对家装家居内容短视频无尽流的开发实践,总结出了一套适应于该场景及衍生场景的前端开发指南,通过阅读本文可以快速了解短视频无尽流的前端开发。前言短视频无尽流是当下比较热门的一种业务场景,在日常生活中随处可见。本文基于对家装家居内容短视频无尽流的开发实践,总结出了一套适应于该场景及衍生场景的...
棣棠
2022-09-15
前端智能化实践——可微编程
研究者表示,由于广泛的科学计算和机器学习领域在底层结构上都需要线性代数的支持,因此有可能以可微编程的形式,创造一种新的编程思想。下面,我们就一起进入这个全新的领域。什么是可微编程通过动画、动效增加 UI 表现力,作为前端或多或少都做过。这里以弹性阻尼动画的函数为例:函数在时是效果最好的。最终,...
甄子
2022-09-13
服贸会在京举行|淘宝直播携手佳能佳直播联合发布《电商直播高画质开播指南》让品质直播触手可及
8月31日至9月5日,主题为“服务合作促发展 绿色创新迎未来”的2022年中国国际服务贸易交易会,以线上线下相结合的方式在国家会议中心和首钢园区举办。在本期的服贸会上,阿里巴巴大淘宝技术联合佳能“佳直播”高清直播解决方案(以下简称“佳直播”)发布《电商直播高画质开播指南》,旨在以标准化和低成本...
大内容中台
2022-09-05
淘宝PC改版!我们跟一位背后付出6年的男人聊了聊……
2022年5月底,淘宝PC首页全新改版。本文讲述了PC改版前后的坎坷故事,以及PC项目组未来的技术布局和思考。2022年新版首页https://www.taobao.com/2021年12月的某个上午,用户本豆习惯性地用电脑打开了淘宝网。大屏看商品细节、多页面可对比,而且上班时间悄悄看个淘宝毫...
大淘宝技术
2022-08-26
上海交大牵手淘宝成立媒体计算实验室:推动视频超分等关键技术发展
7月27日,上海交通大学电子信息与电气工程学院与阿里巴巴集团大淘宝技术宣布达成战略合作,共同成立上海交通大学电子信息与电气工程学院-淘宝(中国)软件有限公司媒体计算联合实验室(下称”联合实验室”)。该联合实验室是为了更好地探索未来媒体时代的极致体验,通过创新和产业结合,推动行业发展。据悉,双方...
大淘宝技术
2022-07-28
国际顶会OSDI首度收录淘宝系统论文,端云协同智能获大会主旨演讲推荐
大淘宝技术团队论文入选计算机系统领域顶级国际学术会议OSDI,这是淘宝系统论文首次入选该国际顶会,论文详解了阿里历经四年、自主研发的首个端到端、通用型、规模化产业应用的端云协同机器学习系统“瓦力”——Walle。OSDI特别邀请到的David Tennenhouse在大会主旨演讲中专门推荐了W...
Meta技术团队
2022-07-18
从0到1,IDE如何提升端侧研发效率?| DX研发模式
DX全称DinamicX,目前是在淘宝乃至整个阿里集团内广泛使用的Native动态化方案,核心优势是性能和稳定性。过去几年一直有其他淘宝/集团的外部文章中有涉及到DX,但DX一直没有对外做过完整介绍,对外界来说这两个字母颇有些神秘色彩。本系列文章《DX研发模式》我们就将拉下它神秘的面纱,看看过...
正物
2022-06-30
如何持续突破性能表现? | DX研发模式
DX全称DinamicX,目前是在淘宝乃至整个阿里集团内广泛使用的Native动态化方案,核心优势是性能和稳定性。过去几年一直有其他淘宝/集团的外部文章中有涉及到DX,但DX一直没有对外做过完整介绍,对外界来说这两个字母颇有些神秘色彩。本系列文章《DX研发模式》我们就将拉下它神秘的面纱,看看过...
岚遥
2022-06-21
2022淘宝天猫618背后的技术秘密
大淘宝技术
2022-06-20
列表容器&事件链如何帮业务提升发版迭代效率? | DX研发模式
DX全称DinamicX,目前是在淘宝乃至整个阿里集团内广泛使用的Native动态化方案,核心优势是性能和稳定性。过去几年一直有其他淘宝/集团的外部文章中有涉及到DX,但DX一直没有对外做过完整介绍,对外界来说这两个字母颇有些神秘色彩。本系列文章《DX研发模式》我们就将拉下它神秘的面纱,看看过...
熌电、中民
2022-06-17
淘宝Native研发模式的演进与思考 | DX研发模式
DX全称DinamicX,目前是在淘宝乃至整个阿里集团内广泛使用的Native动态化方案,核心优势是性能和稳定性。过去几年一直有其他淘宝/集团的外部文章中有涉及到DX,但DX一直没有对外做过完整介绍,对外界来说这两个字母颇有些神秘色彩。本系列文章《DX研发模式》我们就将拉下它神秘的面纱,看看过...
寻弦
2022-06-13
CVPR 2022 | 神经辐射场几何编辑方法NeRF
阿里巴巴大淘宝技术的研究人员和中科院计算所提出了一种允许用户自由编辑神经辐射场几何内容的方法,以论文《NeRF-Editing: Geometry Editing of Neural Radiance Fields》发表于领域内顶级会议IEEE CVPR 2022。基于图像的3D场景建模与渲染...
Editing
2022-06-10
淘宝直播PC客户端的hybrid探索
如何兼具“Native App良好交互体验的优势”和“Web App跨平台开发的优势”在当前互联网时代保持高效的业务迭代是一个非常重要的课题。什么是hybrid通俗易懂的翻译hybrid 英 [ˈhaɪbrɪd] 美 [ˈhaɪbrɪd] adj. 混合的;杂种的 n. 杂种;杂种动物...
穆冰
2022-06-10
Redis 5.0 部分源码剖析
从前有句古话说得好,天将降大任于斯人也,必要先看Redis。以前古人还说过,窗前明月光,低头Redis。古人还说过,所有的答案都在源码里。昨天还有人跟我说,用Redis比Tair申请要方便。不识庐山真面目,只缘身在此山中我们先给出一副大图,来看看Redis AOF Rewrite的总体流程是怎...
时昼
2022-06-09
SIGIR2022 | 流行度偏差如何利用?探索解耦域适应无偏召回模型
召回模型中流行度偏差的现象主要有两种:流行度分部差异、长尾分布差异。本工作主要探索如何改善召回阶段中的双塔模型来缓解流行度偏差。目前已有缓解流行度偏差的方法主要有两大类:逆倾向评分(IPS)和因果图推断。但是,我们认为不能盲目抑制流行度偏差,而应探索如何更好将其利用。所以,本次工作从缓解流行度...
仙基
2022-06-07
合理使用线程池以及线程变量
本文从线程池和线程变量的原理和使用出发,结合实例给出最佳使用实践,帮助各开发人员构建出稳定、高效的java应用服务。背景随着计算技术的不断发展,3纳米制程芯片已进入试产阶段,摩尔定律在现有工艺下逐渐面临巨大的物理瓶颈,通过多核处理器技术来提升服务器的性能成为提升算力的主要方向。在服务器领域,基...
怀可
2022-06-07
MaxCompute中的JSON数据处理
本文收集并对比了MaxCompute中常用的JSON处理UDF/方法,列出了各个方法存在的问题。并最终推荐几种较好的实践。太长不看链接:JSON的提取:方法:FROM_JSON、get_json_object、JMESPATH选择标准:简单字段提取(get_json_object);需要保留原...
猫貂
2022-05-25
深度粗排在天猫新品中的实践
本文主要阐述2021年天猫新品算法团队在深度粗排上关键的优化过程与结果。背景电商领域推荐业务需要根据用户的历史显式反馈建模用户的兴趣偏好,并从海量的商品底池中为用户推荐其最感兴趣的少量商品,整个过程时间一般需要在300ms以内。较为常用的推荐链路包含召回、粗排、精排、重排等主要阶段,每个阶段的...
世卿
2022-05-25
Flutter 新一代图形渲染器 Impeller
Flutter在2022年的Roadmap中提出需要重新考虑着色器的使用方式,计划重写图像渲染后端。最近该渲染后端 Impeller(叶轮)初见端倪,本文将介绍 Impeller 解决的问题、目标、架构和渲染细节。背景Flutter在过去一年多时间解决了很多Jank问题,但着色器编译导致的Ja...
谷鸣
2022-05-25
无线运维的起源与项目建设思考
原本是计划写写无线运维的项目年度总结的,但是想想一个项目总结文章,只是对自己和项目有个回顾和交代,对于无线运维这个新的概念,还不如放开讨论一下。说到这里,可能一些好奇的同学可能会发出灵魂三问:什么是无线运维 ?为什么要做无线运维?无线运维能解决什么问题?因此,作为一个从开发转入安全生产时间不太...
星诀
2022-05-25
手淘购物车这些年那些事儿
本文将从业务发展以及技术沉淀两个方面来总结淘宝购物车的产品升级之路。写在前面从入职以来到如今已有四年多的时间,非常幸运的是,短短职业生涯能有90%的时间都能参与或负责淘宝购物车业务域的开发,这几年来和购物车一起成长,从思考购物车与收藏夹的区别到逐步开始有了对购物车较清晰的定位,从被动接需求到开...
斯遇
2022-05-18
倾向得分匹配(PSM)的原理以及应用
该文章主要介绍倾向得分匹配(PSM, Propensity Score Matching)方法的原理以及实现。这是一种理论稍微复杂、但实现较为容易的分析方法,适合非算法同学的使用。可用于(基于观察数据的)AB实验、增量模型搭建等领域。文章主要分为四部分:前置知识(因果推断)介绍、倾向得分计算与...
八卜
2022-05-07
我在淘宝做弹窗,2022 年初的回顾与展望
本篇文章作者向各位介绍了自己加入 PopLayer 项目一年多时间以来,为产品所贡献的一份力量,既包含了站在产品视角对产品功能,易用性和未来发展的考量,也包括了站在技术视角,对技术架构,编程范式和功能实现上的思考。前言在我刚入职大淘宝技术用户增长团队时,弹窗作为用增站外触达的一种有效手段,需要...
空堂
2022-05-06
基于机器学习的带宽估计在淘宝直播中的探索与实践
本文主要分享 2018-2021 年期间,大淘宝技术内容中台音视频基础技术团队,基于机器学习的带宽预测算法在淘宝直播的业务背景下的探索与大规模实践的成果。背景常见的媒体传输中带宽估计的算法有 GCC/BBR/PCC/QUBIC 等,主要基于传统的基于策略的算法白盒地根据历史网络数据以及主动探测...
折佩
2022-05-06
ACL2022 自监督文本表示新框架ArcCSE
学习高质量文本表示是NLP的基础任务之一,可应用于大量的下游任务。尽管像BERT之类的预训练语言模型获得了巨大成功的,但在文本语义相似任务中,直接用其获取的文本表征往往效果欠佳。最近一些基于对比学习的文本表示建模方法取得了不错的效果,但这些方法更多关注于正负表征对的构建,对训练目标优化不足。如...
钰皓
2022-05-06
因果推断实战:淘宝3D化价值分析小结
观察性因果推断方法有很多,文章主要介绍了PSM、贝叶斯概率图、DID这几种方法,可将文章分享的实践方法作为因果推断分析中的一种参考。 背景介绍为什么需要因果推断统计学有一些有趣的‘研究’:太阳黑子与男性自杀率间存在关系;而一个国家的人均巧克力消费量越高,出现诺贝尔奖获得者的比例越大;甚至还有这...
亦歌、行週
2022-05-06
NTIRE2022视频超分与增强挑战赛冠军方案——渐进式训练的两阶段视频恢复方法
摘要引言相关工作视频恢复视频超分视觉Transformer方法两阶段网络框架第一阶段网络与渐进式训练第二阶段网络与迁移学习实验数据集实施细节客观表现主观表现消融实验NTIRE22结论参考文献
涵璋
2022-05-06
大淘宝技术斩获NTIRE视频增强和超分比赛冠军
2022年CVPR NTIRE比赛结果公布,大淘宝音视频算法与基础技术团队表现出色,在视频超分与质量增强比赛的三个赛道获得两个赛道冠军一个赛道亚军。视频增强和2倍超分冠军近日,2022年NTIRE视频增强和超分比赛成绩揭晓。在三个赛道中,淘宝音视频算法与基础技术团队取得Track1视频增强赛道...
涵璋
2022-05-06
商品序列建模在新用户承接上的应用实践
背景随着淘宝直播带货业务的发展,好玩、互动、专业有品质的购物理念刺激着人们的消费需求。当前平台内中高活用户由于经常光顾,无论是在优惠刺激下的"薅羊毛", 还是闲逛满足自己的购物需求,还是主播的粉丝受众等因素,自然而然地使他们的直播购物习惯,访问主播心智日渐成熟。每天晚高峰大量直播间开播,海量的...
北极
2022-05-05
淘宝Push智能文案生成
本文主要介绍了2021年笔者在智能文案生成项目所做的工作。业务背景Push是淘宝重要促活手段之一,运营同学通过投放各类营销、产品Push以达到唤端、促活目的。Push素材通常由人群、商品或者活动、文案构成,与用户有直接沟通的便是Push文案,优质的素材文案吸引用户点击起到正向促活作用,而劣质内...
方砚
2022-05-05
如何设计一个易扩展、易运维的内容下发服务架构?
内容为王时代,任何一个To C的App都会有内容下发服务,内容包含商品、图文、视频等,比如在淘系App上,首页和各个垂类频道页充满了各类内容,这些页面业务变化非常较快,如何设计一个易扩展、稳定、低延迟的内容下发接口,需要开发同学不断思考摸索。作者总结内容下发服务遇到的常见问题和挑战,设计出一套...
晓橙
2022-05-05
从标准到开源,阿里大淘宝技术的“创新担当”
近期,中国网络通信标准与开源在多方面取得重要进展。阿里巴巴(中国)有限公司联合国内学界提交的《可交互低延时互联网多媒体传输系统需求》(GRTN)国际标准立项提案正式获批通过、阿里巴巴大淘宝技术团队主导自研的IETF QUIC标准化协议库XQUIC也在今年1月7日正式开源。该两项成就都是ICT领...
大淘宝技术
2022-04-11
Spock单测利器的写法
Spock是国外的测试框架,其设计灵感来自JUnit、Mockito、Groovy,可以用于Java和Groovy应用的测试。Spock简介最近发现了一款写法简洁高效,一个单测方法可以测试多组测试数据,且测试结果一目了然的单测框架Spock。Spock是国外的测试框架,其设计灵感来自JUnit...
理莎
2022-03-29
商品3D建模的视觉定位和前景分割方法
2021年10月,大淘宝技术发布了基于神经渲染的3D建模产品object drawer ,用户只需要环拍一圈商品的视频,就可以生成3D模型。在物体重建算法流程中,需要先计算出每一帧图像的相机位姿(平移和旋转)。之后需要对图像中前/背景进行像素级的分割,重建时只需考虑前景而忽略背景像素。准确的相...
伯玉
2022-03-29
内存优化: 纹理压缩技术
相比普通格式图片,纹理压缩可以节省大量显存和 CPU 解码时间,且对 GPU 友好。背景游戏开发中纹理是内存占用大户,移动设备因为内存有限,问题更加明显。据统计,淘宝互动小程序性能卡口 70% 以上都是因为内存超标,而内存超标的主要原因则是图片素材过多、过大等。我们知道传统的图片文件格式有 P...
楚奕
2022-03-22
因果推断:效应估计的常用方法及工具变量讨论
日常工作中很多的策略/产品的效果是无法设计完美的随机实验的,要求我们从观察性数据中去(拟合随机试验)发现因果关系、测算因果效应。因果推断简介作者个人理解:因果推断本质上回答的问题:谁是因?谁是果?这个因会导致多大的果?抽象为两大问题即为:因果发现+因果效应估计。对应到我们日常的业务策略、产品迭...
景里、北澄
2022-03-22
什么是好的技术氛围?
无论哪个行业无论工作多久,每个人都希望自己所处的环境有一个好的氛围,工程师们会希望自己公司有一个好的技术氛围。什么才是好的技术氛围呢?好的技术氛围有什么现象?打造好的技术氛围,又需要做什么工作呢?今天我们邀请了 2 名大淘宝技术的工程师,结合他们真实的学习工作经历,给大家分享一些他们认为好的技...
淘系技术
2022-03-22
MNN开源项目荣获中国科协2021“年度优秀开源产品”
在中国科协召开的2022“科创中国”年度会议上,阿里巴巴两个开源社区荣获“年度优秀开源机构”,五大开源项目荣获“年度优秀开源产品”。日前,中国科协正式发布2021“科创中国”开源创新榜单,推选出50项年度优秀开源产品及相关机构。其中,由阿里巴巴大淘宝技术团队开源的MNN深度学习推理引擎与其他四...
淘系技术
2022-03-22
分布式系统链路一致性踩坑录
本文把问题聚焦在一个用户请求从入口开始在分布式系统这个链路上如何调用来保证一致。说到分布式一定跑不掉一致性。一致性涉及的面域很广。什么ACID事务咯,CAP咯,2PC咯,BASE咯这些概念大家肯定也都懂,网上这样的介绍文章也是一大把。但是是否会用,是否用得上又是另一个问题。本篇文章不讲这些高大...
飞捷
2022-03-22
mysql锁机制的再研究
在分布式系统中,分布式锁已经的使用越发常见,我们系统由于较为老旧,使用数据库实现分布式锁,方案为:使用lock_key, lock_biz组成唯一索引,利用数据库对一条记录insert和delete操作的事务性来实现不可重入的db分布式锁。前一段时间,发现系统分布式锁出现死锁告警,在处理完问题...
点晴
2022-03-22
2022 开发岗 SQL 和 NoSQL 数据库选择指南
本文将通过对比 MySQL 与 MongoDB 的一些性能和特点,来简单刨析结构化数据库与文档性数据库,从而给大家以后在生产环境中数据存储介质的选择提供一些参考。前言SQL 的全称是 Structured Query Language(结构化查询语言),主要用来操作结构化数据库的增删改查与结构...
洋轩
2022-03-18
ESModule 加载与运行机制
ESModule 作为 JS 的标准模块机制,在日常开发中被广泛使用,但在大部分情况下,我们可能只是将其作为 JS 代码文件的组织形式来对待。作为 JS 的模块规范,ESModule 底层其实有一套非常完善的机制,来确保 ESModule 在不同场景下的性能以及行为的确定性。本文的主要内容是关...
川古
2022-03-18
Flutter Web在Liquid体系下的探索
Flutter Web可以解决Native页面无法外投的问题通过Flutter Web,Liquid研发体系可以在保障客户端体验最佳的前提下,实现一次开发三端投放Flutter Web与Liquid研发体系的结合方案成果展示每平每屋Flutter Web商城二级页,可直接用手淘或者浏览器扫码打...
方博
2022-03-14
APM 页面加载耗时校准
在最新的 APM 自动化页面加载耗时计算中,剔除了对用户页面加载体验无效的元素,聚焦页面加载体验中的核心元素,既给了业务相对的自由度,又达到了一定的加载体感准确性。背景APM 的全称叫做 Application Performance Monitor,属于应用性能监控部分。在手淘的 APM 中...
千诺
2022-03-14
前端质量之灰度监控的有效实践
本文将介绍更聚焦灰度监控的报警配置。背景回顾过去3年,前端故障总量并不算太大,但背后的数据反映出经济体前端的安全生产,特别是高可用这个子域,正处于一个相对比较低的水位:经济体故障监控发现率46.8%,但其中前端故障的监控发现率仅为22.7%,与期望的监控水平相去甚远!因此我们开始专门起项治理前...
悠酱
2022-03-14
淘宝 Android 端图片体验优化实践
Android 端图像加载、显示、处理、监控集一体的一站式解决方案。背景Phenix 图像加载体系是立足手淘面向阿里巴巴全集团打造的一款 Android 端集图像加载、显示、处理、监控于一体的一站式解决方案。基于高可用、高性能、可高度定制、数据服务、省流量五大核心优势而被集团各个业务接入使用,...
古迹
2022-03-11
智能化测试服务中台的功能及在不同场景的应用
互联网产品的上线周期短、迭代速度快,为了促使测试工具更有效地替代人工,智能化测试成为一种新的趋势。目前智能化测试主要是将现有AI智能技术融入在不同测试环节,让每个环节以更智能的方式完成质量保障。但是这种碎片化的智能化很难聚焦于适用测试行业的智能技术的提升,因此我们建立了首套专注于为测试行业提供...
居凡
2022-03-11
CIKM 2021 | 淘宝多场景推荐排序模型ZEUS
本文介绍大搜索算法团队发表于CIKM 2021 的论文 Self-Supervised Learning on Users' Spontaneous Behaviors for Multi-Scenario Ranking in E-commerce。论文中提出了多场景推荐排序模型ZEUS (...
靖尧
2022-03-11
淘宝直播端到端音视频评测方案首次公开
淘宝直播质量团队建立线下评测体系,覆盖端到端的多网络环境,包括视频和音频多个指标,支持手工及自动化执行。本文将重点介绍部分指标及自动化方案。背景4G时代以来音视频技术快速发展和规模化应用,孵化并催化内容短视频,直播,社交通讯,在线教育,远程会议等互联网业态成熟。淘宝通过不断积累演化自身音视频技...
冰心
2022-03-11
淘宝内容场下的人物理解系统
本文的人物理解特指对人的视觉特征的识别,即从视觉维度,获取视频或图片中人物的身份、性别、年龄、颜值、身材、服饰、人-物关系等各种信息。背景介绍随着网络通信技术的迅猛发展,主流的信息传播已经揉合了文本、图像、语音、视频等多种媒体形式。特别是近几年出现的短视频和直播正在迸发出巨大的能量。淘系内部也...
少麟、叶盈
2022-03-11
移动域全链路可观测架构和关键技术
本文侧重阐述团队对移动领域全链路技术理念的原创性引入,整篇约1.2万字、阅读需要15分钟,读者将收获移动技术域体验优化的思路转变,以及软件定义体验的沉淀和研发实践。App现有架构挑战2013年开始All in无线到如今,集团移动技术发展十余年,历经几个关键阶段,第一阶段,解决大规模业务并发研发...
执水
2022-03-11
女程序员的工位,藏着她们鲜衣怒码的人生 | 3·8特辑
作为女性稀有职业群体的程序媛,有什么特点?答曰:会写代码。女程序员也是普普通通又可爱大方的女孩子,性别不是边界线,偏见才是。目前,大淘宝技术拥有400+名女性工程师,占总体程序员比例17%。她们正直、善良、勤奋,她们精致、逗比、热情,今天是她们的节日,我们捕捉了6名女程序员的工位,让我们一起从...
淘系技术
2022-03-08
7种经典推荐算法模型的应用
本文调研了推荐系统里的经典推荐算法,结合论文及应用进行分析、归纳并总结成文,既是自己的思考过程,也可当做以后的翻阅手册。前言个性化推荐,是指通过分析、挖掘用户行为,发现用户的个性化需求与兴趣特点,将用户可能感兴趣的信息或商品推荐给用户。本文调研了推荐系统里的经典推荐算法,结合论文及应用进行分析...
羊灵
2022-03-03
消息复杂计算的抽象和简化
本文将介绍客户端消息数据计算的问题与解决方案。消息客户端计算的复杂性在客户端的设计中,一般的分层会至少包含下层的数据服务层和上层的UI层,下层的数据模型主要由所在领域决定,相对独立、稳定,而UI则更多变,且会对多种数据进行组合。由于UI的相对多变性与模型的相对稳定性,在数据层和UI之间,就需要...
四点
2022-03-03
错误处理原则及其在Swift中的应用
本文由两种内容组成,一部分是错误处理的思路,第二种是这种思路如何使用Swift来实现。前言错误处理是程序员最重要-也是最容易忽视的话题之一,程序员经常花费了大量的经历在打印大量日志,完善监控系统上面,但是往往对API返回的错误简单处理,甚至于直接忽略。比如对于OC中移除一个文件:[[NSFil...
四点
2022-03-03
聊聊fastjson反序列化的那些坑
关于json反序列化的几个问题。场景json作为一种可读性很强的格式,现在是广泛使用的。这里罗列两个我需要对json字符串进行反序列化的场景:日志/数据库存储了接口的入参数据,希望通过反序列化来反查问题。远程调用传过来的数据为json串,需要反序列化后使用。而集团内使用得最多的就是FastJs...
谨寻
2022-03-03
淘宝小部件在 2021 双十一中的规模化应用
上篇回顾:淘宝小部件:全新的开放卡片技术2021 双十一,淘宝全新的开放形态「小部件」大促中首次亮相,并且支撑开放业务初步规模化;说起小部件,我们还是先回顾一下淘宝小程序开放的前世今生。小程序开放的前世今生从页面级开放到模块级开放淘宝开放业务的本质,就是通过联合三方开放生态的力量,帮助商家在淘...
千之
2022-02-23
淘宝小部件:全新的开放卡片技术
私域,即品牌自运营的空间,可以帮助品牌持续运营自己的消费者。淘宝也在快速调整私域的布局:淘宝也有非常多的私域产品,譬如店铺、客服、消息等。在这些场景中,品牌商家需要利用创意、内容和服务留住消费者群体,并产生销售转化。但是做私域并不仅仅只是纯销售,更要用内容和服务把人留下来,让场里的人越留越多,...
千之
2022-02-23
内容推荐场景下多模态语义召回的若干实践
本系列将系统介绍召回技术在内容推荐的实践与总结。第一篇:2021召回技术在内容推荐的实践总结第二篇:CMDM:基于异构序列融合的多兴趣深度召回模型在内容平台的探索和实践背景内容分发平台已经成为互联网用户获取信息资讯的主要来源,已经完全渗透进互联网用户的日常生活。内容推荐系统作为精准匹配用户和内...
尤风
2022-02-23
深度粗排模型的GMV优化实践:基于全空间
随着业务的不断发展,粗排模型在整个系统链路中变得越来越重要,能够显著提升线上效果。本文是对粗排模型优化的阶段性总结。背景在搜索、推荐、广告等大规模信息检索场景中,通常会将检索分为召回、粗排、精排三个阶段,每个阶段处理的数据量和目标各有不同。召回阶段,一般由多路召回构成,需要从海量候选集中尽可能...
子空间联合建模的蒸馏校准模型
2022-02-23
淘系端智能技术体系概述
相比云侧智能,端智能具有低延时、保护数据隐私、节省云端计算资源等显著优势。背景近年来,以深度学习为代表的新一代人工智能技术得到了快速发展和广泛应用,模型训练和模型推断基本都在云侧完成。但随着移动设备算力的提升、模型压缩技术的成熟,模型推断在终端设备运行成为可能,端智能(On-Device AI...
吕行、玄裳、明弈
2022-02-23
电商数字化色彩系统的探索
现代营销学之父曾经有说过, 消费者需求主要分为数量满足、质量满足, 以及情感满足阶段。随着社会经济的发展, 消费者对于产品质量进入到情感需求阶段, 达到一个新高度。与此同时, 消费者对于现在生活环境和产品质量的需求, 不仅仅局限于功能特性的实用阶段, 更加注重消费过程中环境美学的需求。此外, ...
望沉
2022-02-23
安卓长列表下快速精准锚定的解决方案
前言淘宝拍照上线了新结果页后,原先的短列表进化成了电梯多楼层长列表结构。根据交互要求,当用户点击楼层 tab时,需要将列表滚动到对应的位置,由于商品区块是支持分页加载的,当商品全部加载完成之后,商品区块会变得非常高,如果用户点击 tab 之后需要跨过商品区块,那么根据安卓原生的 scrollT...
隽弦
2022-02-18
19条跨端cpp开发有效经验总结
跨多端开发避坑指南前言细想,专门从事跨多端开发已两年有余,前段时间因为组里跨桌面端项目需要回归windows下开发了整整2个月,怎么形容这两个月呢,嘿嘿,各种“肆无忌惮”的写法,终于不用在写一行代码考虑后面n个端的行为了,"劳动力"、"效率"得到大幅度解放,但是随着windows发版结束后,我...
鹿慕
2022-02-18
淘宝长辈模式技术实践万字总结
长辈模式就是:字大、简单。 四个字背后代表是近100人的项目组的努力,更是淘宝人的情怀与坚持。今天我们在帮助老年人更好得使用互联网产品,就是在帮助未来的自己。背景与机遇最新一次人口普查,我国60岁以上人口已经超过2.6亿,人口老龄化已经不是趋势,而是现实。更好的帮助银发人群融入数字生活已经是一...
银发版项目组
2022-02-10
【大淘宝技术论坛】阿里巴巴内容化电商技术分享&淘宝3D沉浸式直播间体验
大淘宝技术将于1月15日下午举办大淘宝技术论坛,分享阿里巴巴内容化电商技术,邀你体验淘宝3D沉浸式直播间。报名地址:https://www.huodongxing.com/event/76278292442002021年8月30日,淘宝slogan八年来首次改版,“太好逛了吧”的新slogan...
署名
2022-01-09
CMDM:基于异构序列融合的多兴趣深度召回模型在内容平台的探索和实践
基于内容推荐场景的发展,针对工业界主要召回算法的问题,提出CMDM 。背景随着电商场景和内容场景的快速发展,越来越多的融合场景开始出现。我们服务的场景是一个根植于电商场景下的内容消费场景,这样一个全新的内容推荐场景也给我们的推荐技术带来了全新的挑战。在我们的推荐场景中,我们将推荐系统拆分为经典...
凌祎
2021-12-07
你觉得做程序员期间最开心的是什么?
不管是新入行的程序员还是工作多年的程序员,都会想一个问题,在这份工作中最开心的事情是什么呢?是无bug还是工作中发生的其他一些事情?今天我们邀请了 3 名淘系技术的工程师,结合他们真实的学习工作经历,给大家分享一些 他们认为最开心的事情,希望能让你想起属于你最开心的瞬间。绎兮淘系智能部算法技术...
淘系技术
2021-12-07
Redis 常见面试知识点小结
淘系工程师分享关于Redis 的方方面面。Redis是什么Redis is an open source (BSD licensed), in-memory data structure store, used as a database, cache and message broker. ...
马刺
2021-12-07
2021召回技术在内容推荐的实践总结
本文从跨域联合召会、语义&图谱&多模态、用户多兴趣表征和未来工作四个模块展开。引言内容化这几年越来越成为电商的重点,用户来到网购的时候越来越不局限在只有明确需求的时候,而更多的是没有明确需求的时候,就像是逛街一样。逛逛就是在这样的背景下诞生的内容化产品,打造出有用、有趣、潮流、奇妙、新鲜的内容...
夜胧
2021-12-07
Java 开发工作者每天在做什么?
有很多新入行的网友提问:Java 开发工作者每天在做什么?我刚从学校毕业/刚做完 Java 培训,很想知道在真实的工作环境中,我们的工作场景和任务,有没有前辈能指点一下呢?作为 Java 界赫赫有名的阿里淘系,今天我们邀请了 3 名淘系技术的工程师,结合他们真实的工作感受和项目经验,给大家分享...
淘系技术
2021-12-07
淘系技术飞冰团队正式发布 icejs 2.0 版本
这应该是最完善的 React+Vite 解决方案icejs是什么?icejs 是一个基于 React 的渐进式研发框架,由淘系前端飞冰(ICE)团队于 2020.02 发布 1.0 版本,icejs 目前广泛服务于阿里内部以及社区用户,如下图所示,在阿里内部每天至少有 400 多个仓库基于 i...
鲲尘、大果
2021-11-30
GNN在下拉推荐的应用
长尾QI的表达与样本存储优化工作背景图 1.1 下拉推荐下拉推荐属于搜索场景的导购产品,见图 1.1 所示,其意义在于对用户想搜的Query进行补全,以提高用户的搜索效率。近几年下拉推荐排序模型升级到了深度模型,并进行了多次迭代优化,其中一个关键技术是用户行为序列建模。用户行为序列建模是搜索推...
刘唐
2021-11-26
双11专栏 | EdgeRec:电商信息流的端上推荐系统
本文将介绍在我们电商首页部署的端上推荐系统EdgeRec,以及在端上推荐系统中的算法实践。前言双十一期间,我们业务完成了全面上云,云计算的发展保障了大促期间业务的稳定运行,承接了巨量的流量。在过去的这十年里,依托于大数据,云计算取得了非常耀眼的发展。随着云计算的发展,也面临着一些问题:互联网应...
绎兮
2021-11-18
双11专栏 | 基于可微渲染模型的妆容解析技术
2021年,我们推出了基于妆容解析技术的美妆AR自动配色服务,从而大幅度提升了美妆AR素材生产效率,加速了AR虚拟试妆的商品规模化覆盖。此外,基于妆容解析技术,我们推出了“口红搜”,用户可以通过淘宝拍照上传达人图像,在淘宝中实现同材质、同色号的口红精细化召回。背景近年来,以AI技术和端侧渲染技...
文培
2021-11-18
程序命名的原则与重构
命名是对事物本质的一种认知探索,是给读者一份宝贵的承诺。糟糕的命名会像迷雾,引领读者走进深渊;而好的命名会像灯塔,照亮读者前进的路。命名如此美妙,本文将一步步揭开它的神秘面纱!命名来源生活从左到右:正三角形,正方形、正六边形 正表示边长相等,从而得到正XXX的边长一定是相等的。这些事物的特征...
玄苏
2021-11-18
双11专栏 | 基于神经渲染的商品三维建模技术
2021年双十一,手机淘宝实现了自动化建模和自动化设计技术,可以规模化的针对消费者的个性化需求进行满足,实现商品放我家的效果。看商品不再是看图片、看视频,而是可以把指定商品放到自己家的真实户型中进行展示,AI设计根据指定商品和真实户型进行全屋搭配设计,给消费者呈现整体的设计效果,每个人拥有私人...
淘系技术3D AI团队
2021-11-15
为更美好的商业生态,淘系技术全力以赴
“这是天猫双11的第13个年头,轮回之后,新启之年。Let's go to happiness是今年双11的主题,我们不仅希望为消费者带来购物的快乐,消费体验持续升级的同时,与生态伙伴、客户一起搭建绿色可持续的商业生态。淘系技术推动电商技术不断迭代和持续突破的同时,投入发展More fun、M...
淘系技术
2021-11-15
1