首页 人物 内文

二十年,那些一直渴望用技术解决问题的人

2023年6月2日 文/ 江月 编辑/ 楚明

又一年618如约而至。当5月31日晚上8点的钟声准时敲响,数亿人会涌入京东APP,在同一时间释放巨大的购物热情。

如果你是其中的一员,在点击图片、直播、加购、下单、支付的任何一环,不会感到任何延迟和卡顿。不仅如此,在下单后的第二天,甚至是几分钟之后,京东小哥大概率就会敲响你的家门,不会让你陷入焦急的等待。如果你对收到的商品存在疑惑,需要去APP上找客服,接待你的可能是一个智能机器人,但它不再显得笨拙、冰冷,而是能够条理分明又善解人意地跟你对话。

而在这每一次点击、每一项体验背后,隐藏的是上万名技术人迭代了20年的京东技术。每天,他们试图敲出带来改变的下一行代码,带着京东走过被大流量冲击的年代,之后又把技术种子播撒到外部世界,融入生活的每一个角落。

但无论如何更迭,京东技术始终围绕着一个不变的圆心——解决实际问题,创造扎扎实实的价值。这是技术人执着且永恒的追求,也是他们试图靠近的技术的本质。

文|江月

编辑|楚明

图|受访者提供

「扛过洪峰流量,就好比考上名校」

超过26万名京东快递员开始在路面上流动。此时,面对新一年的京东618,峰值同比增长112%的开门红流量顺利度过,快递员也迎来了一年中最为忙碌的时刻。他们穿着鲜亮的红色工装服,熟练地挥动PDA,把从全国超过1500个仓库中传递到配送站的商品扫码后有序装车。之后,他们驶向各自熟悉的街道和小区,敲响每一个下单用户的家门。

无论你处于拥挤忙碌的一线城市,还是偏远的农村山区,抑或边界地区,在618开始的晚八点,流量最为猛烈的时候,你都可以顺滑地访问京东APP,浏览图片、视频、直播,并把喜欢的物品加入购物车,完成下单支付,中间不会遇到丝毫的延迟和卡顿。之后,根据你所在地区的仓储货量、运力情况,系统会规划出一条最为合理的配送路径,以最高效率把物品送至你的家门。

如今,这种「京东效率」正在突破许多人的想象。一个令人深刻感知的细节是,在这次618活动中,一位生活在西藏海拔最高村庄的村民,当晚就收到了购买的智能液晶电视。

事实上,在这场京东应对的一年最为复杂的业务场景中,用户的每一次点击,商品所抵达的每一个节点,背后都有一套庞大而复杂的系统在提供支撑,而在系统之后,则是守在各自电脑屏幕前的上万名京东技术人。流量洪峰抵达时,技术「作战团队」早已聚集在公司总部A座4层的十几间会议室里,紧盯着屏幕看各项指标变化,以便及时应对任何一个可能出现的问题。

交易服务研发部负责人尚鑫在京东干了16年技术,如今靠近额头两侧的发际线已经严重后移。他说,在京东内部,618像是技术人员每年要应对的一场高考,扛过洪峰流量,就好比考上名校,走在办公室可以「抬头挺胸,昂首阔步」,但如果系统出现事故,技术人员输了最为关键的这一战,不但脸上无光,还会倍感自责,「接下来的半年,走到哪都得猫着腰,低着头」。

因此,在这场事关荣誉而又没有硝烟的战争中,尽管积淀了多年成熟的备战经验,流量洪峰来临的前四五分钟,压力的乌云还是深深笼罩着尚鑫,他形容那种感觉,「就像复习多年去参加高考,还是一样会紧张。」单是在工位上坐着,他的心率也会不受控制地加快,手表上的心率数字从70,涨到90,再涨到130。他习惯了提前吃一颗降压药,让自己的心跳平缓下来。

5月31日,晚上8点整的钟声终于敲响。这一刻,数亿人聚集在京东APP提交订单的页面释放巨大的购物欲望,与之相对的是,拥有强大计算能力和资源存储能力的云计算也开始了无声息的战斗。「在购物中,我们感受不到它的存在,就像用笔记本电脑感受不到CPU的存在一样。」

系统之所以能藏匿得无声无息,带给人们不卡顿的使用体验,是因为2022年,京东云打造出云舰2.0这一项非常重要的武器,它运行着全球最大的容器集群,堆起来能达到1.5座珠穆朗玛峰的高度。不仅如此,和云舰一起工作的还有一名智能化的「调度大师」,可以在虚拟空间中自动搜寻闲置资源,调配它们去流量大的业务上临时值岗,以此抵抗流量洪峰。

也是在2022年,京东云依靠云舰接受了一项此前从未应对的艰难挑战。在那一年的1月15日,央视正式宣布京东成为春晚的独家互动合作伙伴,留给技术团队备战的时间只剩下19天,他们要面对的难题是,在没有一家外部技术伙伴可以分流的情况下,如何让系统扛过海量春晚观众抢红包时造成的流量洪峰。

何方是京东云产品技术规划部负责人,也是京东13年的老员工。在京东总部一间会议室里,他穿着一件简约polo衫,头发冒出白茬,向我描述彼时系统所面临的压力。「就像把三峡大坝的水蓄满了,物理世界里泄水还有一个过程,但流量是虚拟的,到点那一刻,用户都去点提交,大流量瞬间下来,系统就必须得立马承接住。」

此前,多家互联网公司都参与过红包活动,但流量太过巨大,系统无一例外出现问题。按照以往逻辑,承接大流量最保险的做法是增加服务器,但京东系统经受多次大促考验,已形成一整套完整的流量应对体系。「最终,京东云在没有增加一台服务器的情况下,让全国观众都特别丝滑地把红包抢了。」何方兴奋地说。虽然刚接到挑战时,团队不可避免地感到紧张,但到备战后期,大家的信心越来越高,直到接近实战时刻,所有人不再恐慌,甚至变得非常放松,期待流量可以来得更猛烈一些。

何方(右一)跟同事开会

蛮荒时代

顺利应对大促和红包挑战之前,京东技术曾经历过一段蛮荒时代。

何方是2010年加入的京东,在他的印象中,那时的京东日均订单量已经从几千单增长到十几万单,但技术团队还很小,只有几百人,用的系统架构和工具也非常老,根本谈不上云计算和容器这些虚拟技术,一个应用要上线,只能依靠购买物理服务器,安装好之后,应用才能在机器上跑起来。

那是一个互联网迅速崛起的时代,也是京东追赶技术变革的时代。很长时间里,京东把每周二和周四定为应用上线日,为了不干扰用户白天的使用,上线只能等到零点之后。深夜里,周围写字楼的灯光已经渐渐暗下去,但京东公司仍然灯火通明。网约车司机也摸准了京东员工的作息,每逢这两天,一大波司机像是赶去宴会散席的现场,聚集在京东公司楼下,等待接应下班后暂时从代码中脱离出来的技术人员。

早期,因为没有好的部署工具,应用上线一度只能靠人工执行。研发人员写好代码后,会在运维部排起一条长长的队伍,等待验证执行结果。热烈拥挤的现场刻在了老员工的印象里,「就跟买房子排号一样。」如果检测顺利,一两点钟可以走完上线流程,因此,有的研发人员为了可以先上线,会在排队时随身带一罐可乐,送给运维部的同事,希望对方把自己的业务往前排。后来,这种办法在公司内部蔓延开来,一个晚上过去,运维的工位上经常排满一长溜的可乐。

那是京东技术「老人」记忆里所经历的最为艰苦又朴素的一段时光。

但如果检测出现问题,意味着上线失败,研发人员就几乎下不了班了。他们会立马回工位改bug,再经过一轮测试、检验,整个流程跑下来,通常要熬满一整个通宵。「大家很拼,出了问题,不是想着什么时候能睡觉,而是想着怎么尽快把问题给解决了。」那一年,何方已经感受到熬夜对身体的消耗,「不仅耗脑力,肚子还容易饿。」有一次,团队拿了一些团建经费买披萨作为加班餐,何方被人拉着说了两分钟的话,想再去抓一块披萨,结果发现已经被抢完了。

等熬到早上,问题得到解决,「身上的包袱就解开了,人是一点压力都没有的。」走出公司,隐匿在云朵后的太阳映衬出朝霞,清爽的晨风正在吹散夜战残留的紧张和喧嚣。坐上回家的出租车时,何方带着轻松、愉悦的心情,感受着城市在慢慢苏醒。

即便技术人员经常加班加点,但流量呈现指数级增长,技术很难赶上它的步伐。何方记忆最深的是2011年举办的一场图书大促活动,流量瞬间超出了所有人的预期,直接把系统压垮,出现几个小时的宕机事故,用户被卡在提交订单或者支付页面,无法完成下单,「相当于商场关门了几个小时,所有业务归零,整个活动都白搞了。」

到了同年11.11,流量同样来得迅猛,系统再一次被打趴下。技术人员手忙脚乱地排查代码,也不知道问题出在哪。尚鑫记得,当时,不同技术部门的打法和体系还不统一,只能翻倍往上堆服务器,但把流量一放开,「系统立马又『跪』了」。「那种感觉就像是打一场战役,兄弟们上一拨『死』一拨,到最后无计可施。」

随着流量这把剪刀张开的口子越来越大,技术的敞口也跟着变大。但在何方看来,「宕机是危,也是机。」在这之前,他每天乐此不疲地上线应用以支持业务需求,沉浸在一种自我突破的狂热情绪中。

但伴随着大流量时代的来临,他和团队开始不断探讨,「技术真正的使命和价值是什么?」

京东总部

倔强生长

何小锋是京东云混合多云首席架构师,他说话声音很轻,情绪少有起伏,是一名遇事冷静的典型技术人。2012年左右,在京东发展技术的迫切决心下,一个非常核心的问题开始困扰着他——每年过完春节,研发团队就开始为当年的618发愁,忙着找采购预定十几万一台的服务器,一台台价格高昂的机器「就跟腌咸菜一样」被存进机房,经受灰尘以及时间造成的老化,只为了抵抗几分钟的流量洪峰,之后又陷入漫长的沉寂。

这不仅给公司造成巨大的成本浪费,而且应对流量时,机器需要靠人工腾挪,就像上阵之前临时装子弹,大大降低了应战的稳定性和效率。为了挖除这个痛点,何小锋开始带着团队里的几名校招同事不断查资料,看国内外的技术产品,想要找到技术创新的方向。团队虽然精小,但成员像海绵一样吸收知识,把业界能找到的代码翻看了一遍。

作为团队负责人,何小锋更是把所有心思花在代码上,在不重要的会议上,开车通勤的路上,思考的都是如何根据特定的应用场景定架构,做设计。

那时,何小锋一边研发新版本,一边还要保障老版本不出问题。他记得,为了不影响第二天的业务,技术人员经常会在半夜收到邮件、短信警报,有时甚至是电话通知,就像急诊医生接诊一样,去公司紧急修改代码。

「压力确实挺大的。」何小锋坐在对面的黑色办公椅上,回顾当时那种不确定、快节奏的工作状态,语气依然是淡淡的,情绪保持着平静。

然而,在技术寻求突变的同时,业务也在不断扩张。2014年之前,业务看着电商市场的玩法变得繁杂多样,充满期待地把需求提供给技术,例如扩充商品品类、优化优惠券功能,这让技术感到应接不暇,完全赶不及开发,只能满足业务六七成的需求。到了大促前一个月,为了全心备战,技术腾不出精力和人手,甚至会拒绝业务的新需求。

「豪不夸张地讲,业务跑得飞快,研发就被拖在地上『摩擦』。」尚鑫说,也因此,业务经常指责「技术啥也不是」,动不动就让公司「损失好几个亿」,技术却无法辩驳,只好说技术团队「智商高」,以此维护自身微薄的骄傲。

那时,尚鑫最不能接受的是业务看研发团队的眼神,带着一种高高在上甚至「蔑视」的味道。他印象最深的是2013年左右,一次系统扛不住流量,业务的眼神里表现出习以为常,似乎对技术早已不抱期望。「这种打击是毁灭性的,就比你跪在那儿抽耳光还难受。」这也激发了研发团队的战斗精神和必胜信念。

何方对当时的处境也深有体会。他认为业务和技术最核心的一对矛盾在于——需求是无限的,而资源是有限的。在他看来,技术人员本质上应对的最大挑战,是如何把资源的极致性能发挥出来,用更小的资源去承接更大的需求。但技术迭代不是一件容易的事,研发团队仍然需要时间去创新。

改变最终发生在2014年。一项名为Docker的容器技术被何小锋所在的团队看中,能够把资源更好地从死板的物理机中解放出来,做到弹性使用。当时,国内很少有公司把容器技术使用在大规模的电商场景中,何小锋在研发内部经过一系列测试,发现它发挥出很好的性能,并把它推向了业务。于是在这一年,容器技术第一次使用在618中,尚鑫十分感慨地说,「以前系统崩了,大家会感到手忙脚乱,无所适从,但在这一年,大家有了新的武器,就能做到忙而不乱了。」

在系统第一次抵抗住大促的那一年,何小锋用「无比震撼」形容那一刻的心情。多年在技术迷宫中摸索,每一次拨开迷雾,找到技术的突破方向和路径,何小锋都会感到一种前所未有的价值认同。

何小锋(左一)

随着云和容器等技术的进步和稳固应用,宕机事故逐渐成为远去的历史,研发人员也不再需要排队去等着上线了,许多问题可以在工位上通过几次鼠标点击解决。到了2017年,京东第一次实现大促备战常态化,活动开始后,技术人员通过一块大屏幕,就能看到系统整个运行的情况,不管哪个部分出了问题,技术都能清晰地看到定位,并快速地响应解决。

对于京东而言,业务模式总在发生变化,技术更不会停止更迭的步伐。在这个充满挑战而又日新月异的行业,技术人员从不停止摸索,终于在大促实现常态化备战之后,和业务短暂并肩而行,又并迅速赶超在了业务的前面。

或许是从那时候开始,尚鑫感到业务看待自己的眼神不一样了。渐渐的,技术不仅能满足业务的需求,还能提出新想法反哺业务。

尚鑫举例说,早几年,京东APP有一次搞促销活动,优惠券的玩法十分复杂,消费者在购物时,会感到面前横亘着一道难解的数学题,他们费尽脑力,却无法计算出商品的最低价,优惠券反而阻挡了许多人下单的欲望。后来,尚鑫和团队花了两个月时间写代码,系统可以自动算出商品的最低到手价。功能上线后,大大提升了用户体验,也获得业务的好评。

尚鑫(右一)

不断迭代的人工智能

这是一场依赖技术而完成的拯救行动。

2020年6月,一名广东中学生在京东APP购买药物时,咨询京东的在线客服 「一下吃完一整瓶还能活着吗?」作为业界首个大规模商用的情感系统,客服背后的言犀人工智能应用平台已经具备强大的情感智能、决策智能,保障「流畅、丝滑」地与每一个用户对话,解答用户所难。还可以判断生气、失望、愤怒、焦虑等7种人类情绪。每天,它要面对京东超5.8亿活跃用户、1000万个自营SKU和数十万商家,处理的对话服务达到1000万次。

在庞大的数据中,言犀可以化身金牌导购、服务专家,也能关注到每一个发出特殊「求救信号」的人。在上面那条简短的提问发出后,言犀立马觉察出背后隐藏着轻生讯息,它及时向危机中心发出了第一时间预警。危机专员由此介入,开始查询用户订单,发现这名学生近期购买了大量药品。于是,危机专员联系商家暂停发货,一边对学生进行在线疏导,一边向当地公安报了警。后来,在各方联动的干预下,公安找到学生,劝导学生退掉订单,也帮助他打消了轻生的念头。京东智能客服的「生命通道」项目也因突出的社会贡献入选网信办人工智能企业典型应用案例。这也是人工智能背后的温暖。

刘丹是京东智能服务与产品部研发的负责人,2012年初他加入京东,那时京东智能客服还没有上线,但业务发展的速度太快,入职不到一年内,客服规模翻了数倍,为了分担人工接线压力,京东决定成立智能客服项目组,由刘丹等同事牵头研发第一代机器人客服JIMI。

如今回头看,第一代机器人显得较为笨拙,只能简单查询订单和物流情况,并且同一个问题换一种问法,机器人可能就识别不了。2014年,刘丹所在的产品研发团队开始使用更为强大的深度神经网络模型,试图为机器人更换一个大脑。一个充满期待又饱受折磨的过程开始了,团队成员需要清洗大量数据,投喂给机器,京东智能服务与产品部架构师张振庭把这个过程类比为「培养一个小孩」,每天,他都要把许多事实告诉机器,让它逐渐学会分辨对错。「机器学会后,才能发挥自己的想象空间,让对话形式变得丰富多彩。」

和云技术一样,智能客服发展的初衷也是为了解决大促问题。很长时间里,一个现实问题困扰着客服中心,每年618、11.11活动开始后,流量同时涌进后台的人工客服,为了及时解答用户疑问,客服需要一直坐在工位,用键盘敲出一句句让用户满意的回答,整个夜晚过去,他们甚至连上厕所的时间都抽不出来。到了2017年,把客服从工位上短暂解放出来成为人工智能亟需解决的问题,京东智能服务与产品部为此花大量时间打磨,终于在机器人发展的第二个阶段,实现了机器和人工的无缝隙转接。

陈鹏也是智能服务与产品部的一名技术负责人,他用一个鲜明的事例解释了这项功能:假如你在京东购买了一台空调,不确定是退货还是换货,给出的语义逐渐变得复杂,超出机器的理解范围,机器会自动把对话转接给人工,人工根据之前的对聊记录继续回答,中间不会有任何卡顿。陈鹏记得,这项功能第一次在618期间使用时,人工客服把简单问题交给了机器,终于腾出了上厕所的时间,客服中心的同事因此无比兴奋地说,「黑科技大显神威。」听到赞叹声的那一刻,陈鹏感受到一种前所未有的幸福,「技术不是一种架空的虚荣,而是落实到了产业实处。」

伴随着京东的不断成长,京东的人工智能技术也在不断迭代。2019年之后,智能客服不仅能辨别人的情绪,还学习了不同地区的方言。在京东APP上,它逐渐覆盖了数十万商家,甚至有很多店铺开始用数字人直播带货。如今,这项技术充分满足了内部需求。

要实现技术价值的最大化,走出去是一条必然的路径。智能客服因此也迈向了商业化的道路,开始对社会产生更大的价值,特别典型的就是和各地政府的12345城市热线合作。

在各地的政务大厅里,接线员工位上的电话铃声一天24小时都在响起。蒋芸是东莞12345热线的一名话务员,要做好这份工作,她需要一边耐心听取市民诉求,一边创建工单,判断对方的问题属于什么类别,由哪个职能部门负责转接。因为步骤复杂,部门繁多,蒋芸的工作效率一直提不上来,这让她感到很大的压力和负担。而在电话另一头,市民有着更为急迫的无奈,通常打了五六通热线还是接不通,只能听到语音重复播报「人工座席忙」,而且声音里不带一丝情感。

京东智能客服言犀的介入改变了这个局面。只要有电话进来,言犀总是等候在那里,每天24小时在线,负责第一时间把电话接起。它耐心听取市民的每一句抱怨,并从中甄别出有效问题,依托于大数据,把诉求转接到相关部门。这让市民和接线员有了全新的体验。

一个故事是,2021年4月,一位山西大同的女士拨通热线,投诉小区夜里有人挖树,噪音严重干扰了睡眠,言犀不仅感受到她的焦虑情绪,对她说了安抚的话语,还及时把电话转接给值班人员,让社区人员出面解决了噪音问题。

这是京东人工智能在政务领域的真实实践。根据山西大同的数据,言犀加入市民服务热线之后,热线日均呼入总量增加31.7%,有效诉求提高33.6%,办结率达到了97.9%。

但那已经是京东第三代智能服务机器人的故事了。对于整个自然语言界来说,今年Chat GPT的发布是一项前所未有的轰动事件,效果超出以往任何一个模型,引发公众广泛讨论。京东在人工智能领域有多年的积累和实践,正在基于真实的业务场景,筹备产业版大模型。

京东智能服务与产品部智能算法部负责人吴友政正期待着第四代机器人的到来。他说,京东人工智能的发展一直围绕着两个核心问题,一是如何让机器准确理解人的意图;二是理解之后,如何给出一个合适的回答。在达成这两点的道路上,每一次攻克技术的硬骨头,吴友政都会有很大的成就感。

在京东,吴友政主要聚焦于自然语言处理、人机对话、语音识别等前沿技术研究和产品研发,曾发表过30多篇国际会议和期刊论文,加入京东后,还被集团内部授予过最高的技术金牛奖。但这都不是吴友政感到最为兴奋的时刻,他的快乐来自于另一个维度——「生命通道」拯救了一个个鲜活的生命,言犀每时每刻都在帮助市民解决问题。这些回馈会在吴友政心里留下深刻的烙印,它们无一不在证明着,技术不单以飘渺的奖项被定义,而是能给人类的生活带来实在的便利。

智能服务与产品团队与东莞12345讨论项目实施情况

技术的魅力

5月31日,在刚过去的那个清朗凉爽的夜晚,系统平稳地承接了晚8点的流量高峰,京东公司总部A座4层响起一阵热烈的掌声,所有人开始发自肺腑地欢呼、鼓掌。「就像是在庆祝一个特有的节日,一次共同的胜利。」一名京东员工说。

何方用「热火朝天」形容那个瞬间的感受,那是技术人赢得考试后作出的最诚实的回应。一向情绪平稳的何小锋也沉浸在这种雀跃中。高峰过去之后,办公室里的气氛就变得截然不同,伙伴们从几分钟前紧张地沉默不语,一下子变得自由和热络起来,他们忍不住感受着努力付出后所获得的新一次的丰收。

然而,尚鑫的感受略有不同。让他真正愉悦的瞬间,不是流量过峰后的胜利,而是正当它来临的那一刻,所有成员在工位上平静地坐着,紧张而有序地盯着监控,执行提前预设的方案。这让他联想起多年前,在数字基础设施落后的年代,他无力地面对被流量冲垮的系统,就像面对抢救室里一名血崩的病人,「你想救他,但又不知道从哪里下手。」如今,明亮的办公室里响起键盘敲击的清脆声,平静也取代了慌乱。

尚鑫享受着「此时无声胜有声」的感觉,那是技术彰显魅力的极致时刻。

同时,这种技术魅力正在不断地从京东内部传向外部。近几年,随着互联网不断发展,越来越多的传统企业想要踩上时代浪潮,践行互联网模式和数字化转型。2021年,何方转入京东云团队,开始负责云的商业化,对接急需转型的传统企业。与这些客户合作时,何方发现一些公司所用的技术太过落后,因此造成高昂的生产成本,而他所要做的核心工作,就是用京东云的技术帮助它们降低成本。

何方记得,2021年,一位老板曾愁眉苦脸地找到京东云,他被某家云厂商垄断,无法承受对方提出的价格。何方给那名老板介绍了混合多云云操作系统,帮助公司构建了多云的能力。随后,云厂商的垄断被打破,不仅没法抬价,还主动提出降价,老板最终从困境里走出来,脸上露出欣喜的笑容。那也是何方感到最为开心的时刻。「当客户采纳了一个方案,IT成本立马降低20%-30%,甚至是50%时,我们比客户还高兴。」

在京东工作多年,技术总能不断地制造出新的幸福感,何方对技术的价值理解也走过了不同的阶段。13年前,在还是一名年轻的程序员时,他最开心的是每周二和周四的应用上线日,看到开发的功能立马转化为公司的实在收入,就像交卷的孩子收到一颗奖励的糖果;后来,到了大流量时代,何方认为保证系统稳定不宕机,是技术所能实现的核心价值;但如今,京东技术已经走向外部世界,他才进一步感到,技术其实是一颗颗蒲公英的种子,需要飘向更广阔的土壤,在不同的产业领域发芽生长。

「当技术发展到一定阶段,力量是非常大的,能够维护市场公平,甚至介入整个社会的运转,而其中的人,能够更加便利和快乐地生活,这就是技术的终极价值。」何方说。

事实上,京东技术走过二十年,从抵抗内部流量洪峰,到拓展业务方向,再到深入产业领域,抵达广阔的外部世界,每一次更迭都围绕着一个不变的圆心——解决实际问题,创造扎扎实实的价值。这是京东技术人执着且永恒的追求,也是他们试图靠近的技术的本质。

但技术的变革永远没有终点。如今,在走过今年618的流量洪峰之后,在无数个京东办公室的工位上,技术人员都致力于敲出带来改变的下一行代码。每天,他们穿梭在大大小小的办公室和会议室,修订一版又一版的技术方案,试图用更细的触角,触达我们生活的每一个角落。