张钹 天才的决心
张钹用自己的职业生涯,培养了整整一代人工智能人才,而留在这些人身上的坚持,构成了我们今天所面对的技术现实。
这是一位老人和他所改变的一代人的故事。张钹讲起他的学生们总是最高兴的,他还给这个学生群体取了一个名字——清华代表队。
文|李斐然
编辑|金匝
图|(除特殊标注外)尹夕远
最好的学生
人工智能是一个很容易把人讲糊涂的领域。这个学科充满未知,又不断自我颠覆,一旦问了稍微深入一点儿的问题,对话就会开始变得缠绕,越来越多术语,越讲越复杂,越讲越听不明白。往往只有天才,才能够将复杂的AI讲得简单,谁都能听得懂。
这种感受在见到张钹的时候最为强烈。他今年89岁,在这个领域工作了46年,跟他聊起人工智能,不管是多么前沿的话题,抑或是晦涩艰深的专业知识,他都能用清晰的几句话给人讲明白,一针见血抓住本质。也正是他的这种天赋,让他教会了一代又一代中国年轻人,究竟什么是人工智能。
张钹是清华大学计算机系的教授,也是我见过的聊起人工智能时最轻松自在的人。他参与了清华大学人工智能方向的筹建,创立了人工智能专业。他的整个职业生涯践行了「活到老学到老」,75岁的时候,学生去拜访他,发现他还在做数学题,他说概率论很重要,怕自己的数学生疏了。他在80岁之前,每年要求自己努力发表独立研究的论文。尽管现在到了89岁,一个早已可以退休的年纪,但他还在学习新知识。
「这次是真的突破,过去人工智能所做的研究跟信息时代差不多,只是对信息形式的处理,进步不大,现在变为处理信息的内容、处理信息中所包含的知识,这是一个重大转变,目前所有的变革都是从这一点引发的,所以我们讲,这次是真正的突破。过去人工智能总容易夸大所取得的成果,导致大家过分乐观。当时搞人工智能不大需要数学,能自圆其说就好了,现在则难以自圆其说,必须深入到数学里头去,才能真正搞懂它的技术问题。」张钹说。
张钹是中国人工智能最重要的见证人。他是中国第一位人工智能领域的中国科学院院士。人工智能历史上的许多「第一」都与他有关——第一个在国际顶级杂志上、第一个在人工智能领域顶级会议上发表人工智能学术论文的中国科学家,引进了中国第一台机械臂,创立了第一个人工智能领域的国家重点实验室,建立了第一个与人工智能领域有关的博士点。清华大学设立「人工智能」这个学科方向,也是他第一个提出来的。
事实上,只要愿意,张钹完全可以讲一大堆术语:他是国际上最早提出用数学模型解决人工智能问题的学者之一,他和弟弟张铃提出的问题分层求解的商空间理论,在国际上被归属为粒度计算领域的三大学派之一,这个理论有力推动了中国粒计算研究的快速发展,他也因此获得1995年的国家自然科学三等奖。不仅如此,他在人工神经网络上系统分析了典型神经网络模型,提出了一种自顶向下的新的人工神经网络构造性学习方法。2020年,他系统阐释了「第三代人工智能」的概念,引领国内的人工智能发展。
在我们的访谈全程,张钹讲的都是最朴实的道理,这是他的一种坚持。人工智能热潮之后,很多地方邀请他去做报告,请他讲讲,他每次都是像在清华给学生讲课一样,针对对方的需求重新拟定讲稿。有时对方嫌他的PPT太简单,版面不够华丽,还发给他模版让他改得复杂一点。那些模版都是当下最流行的,满屏密密麻麻的术语、曲线、表格、图片,甚至视频。但张钹坚持用自己的PPT,「用自己的PPT可以按自己的思路来讲,要讲出自己对问题本质的理解」。
他的同事、清华大学计算机系教授朱文武用三件事定义张钹:「第一件事是,40多年前,他能在那个特殊的时代引领中国人工智能发展,创立国家重点实验室,这是厉害的;第二件事是25年前,他能在微软亚洲研究院当顾问委员会委员,在海外一流大学教授、图灵奖得主中间,他的指导意见令人服气,这也是很厉害的;第三件事就是最近这10年,他提出了第三代人工智能的理论。一个人在每个阶段做一件事是可能的,但一个人同时把这三件事做完了,我觉得这是真的了不起。」
1986年8月张钹应邀访问英国爱丁堡大学,在人工智能系做学术报告受访者供图
张钹的成就大多都有文字记载,他的专著,他提出的理论,他的学术成就,他有200多篇学术论文和五部专著,但后来我发现,这位清华老教授还有一份更重要、却鲜有文字记录的成就。他留下的不止是教科书、实验室、教学方法,以及不断更迭的人工智能知识。他对国家更大的贡献是他所留在其他人身上的原则,在他所培养的一代又一代学生身上,有一种共同的使命感,以及一系列做事的根本性原则——基于人工智能技术,我们应当做什么?不做什么?坚持的原则是什么?什么才是我们所追求的技术未来?
清华有句口号叫做「为祖国健康工作50年」,张钹在73岁那年实现了这个目标,他的学生们在系里给他办了一场从教50周年的庆祝会,他在会上开玩笑说,中国当老师的最高标准是孔夫子,如果拿他和孔子比,他觉得自己有三个指标有望超过这位万世师表:
第一,他的教龄比孔子长。孔子30岁开始讲学,72岁去世,教龄42年,「我已经从教50年了,并且还将继续」。
第二,他的学生比孔子多。孔子有三千弟子,也就是听过他讲学的人,「听过我的课的学生肯定超过3000人了」。
第三,孔子培养了七十二贤人,张钹把这一点定为了职业目标,「我要培养超过72个博士生」。
我见到张钹的时候,他仍在继续带学生。他很高兴地告诉我,等明年,自己又有一位博士生毕业,他将会在90岁那一年,完成培养90位博士生的事业。
我仔细翻阅了他所有博士生的履历,这是一个影响力极大的群体,几乎所有人都从事了计算机相关的职业,其中涵盖了人工智能领域最主要的研究和产业方向,很多人是各自领域内全国乃至世界范围内的领军人物,他们共同构成了中国人工智能发展的根基。这位老人用自己的职业生涯,培养了整整一代人工智能人才,而留在这些人身上的坚持,构成了我们今天所面对的技术现实。
这是一位老人和他所改变的一代人的故事。张钹讲起他的学生们总是最高兴的,他还给这个学生群体取了一个名字——清华代表队。
1955年夏,张钹任班长,组织清华大学电83全班同学到京郊樱桃沟野游时集体合影,后排站立者右二为张钹受访者供图
坚持
张钹的办公室有一整面墙的书柜,里面装着他的职业生涯。书柜里有好几层空空荡荡的架子,那里曾经放着人工智能的专业书,它们在数次技术变革中落伍了,「全都扔了」。留下来的书柜里,顶端一排放着旧书,是他关于商空间理论所写的《问题求解理论及应用》,以及《人工神经网络理论及应用》,这些书都分为中文版和英文版。但他更在乎的并不是自己的著作,他指着柜子中央两排整整齐齐的论文集,「这是我真正的作品」。
那是张钹所有博士生的毕业论文。那一栏里的很多名字,现在已经成为了人工智能领域非常有名的专家。摆在最前排的论文里有一本属于马少平,他是张钹在1995年招收的博士生。现在的他,也是清华大学计算机系教授,是今天人工智能领域里非常重要的学者,是在智能信息处理和信息检索领域深耕了超过20年的专家。这在当下的环境里是很少见的,而这份坚持,正是张钹留给他的原则。
马少平是清华大学1977级的学生,也是恢复高考后第一届上大学的学生。当时清华大学正在筹建计算机系,还要设置那时候谁也没听说过的「人工智能与智能控制」教研组。如今许多热门专业,包括自然语言处理、汉字识别、语音识别、机器人,在上世纪70年代末的清华已经出现了。他记得入学的时候新生可以参观不同院系,计算机系的人工智能展示室显得最特别——房间里有一个机器,模仿阿里巴巴和四十大盗的故事,喊芝麻开门,灯泡就亮了;喊芝麻关门,这个灯就关上了。
今天看来已司空见惯的语音控制,在上世纪70年代,让这个年轻人产生了极大的兴趣。他抱着强烈的好奇心,开始了自己的人工智能生涯,在这里学习了最早的人工智能课程,听张钹讲人工智能导论,学习人工智能编程语言。
马少平上课选的大作业是教机器下五子棋,硕士毕业论文写的是汽车的自动驾驶。当时国内没什么材料,查国外信息又很困难,他就经常去找张钹帮忙。张钹当时是系里少数去过美国访学的老师,也会热心地给他出主意。马少平改造了日本二手车,给马达加控制。由于当时没有GPS,没法自动记录轨迹,他们想出来的对策是在车上放一桶水,用一根管子引出来,让它滴水,通过看路上的水的痕迹,来判断自动驾驶的路径。最后他毕业作品的展示是在清华主楼的两个门洞之间,从右边的门洞开进去,从左边的门洞开出来。这就是1984年清华学生实现的自动驾驶。
坐在办公室里,马少平讲起这些往事的时候一直笑。这是他最初从人工智能研究里得到的乐趣。后来他留校任教,又选择张钹做自己的博士导师,跟他一起参与筹建人工智能国家重点实验室。张钹引进中国第一台机械臂PUMA560的时候,国外还在对中国实行禁运,经历了一番波折后,才运到北京,他跟着张钹一起去西苑机场,接收了中国的第一台机器人装置。
然而,上世纪90年代,人工智能进入了寒冬期,没有太多项目和任务,很多人开始转行,但马少平做了一个当时少有人做的决定,他选择了汉字识别研究方向,继续在这个自己觉得有意思的学科里深耕。
「张老师说过一句话,对我触动比较大,其实我在早期,尤其是人工智能低潮的时候,也是有时做做这个、有时做做那个的,但后来我基本上只在信息检索这个方向在做了。选这个方向当然跟我和张老师当时的讨论有关,但20多年坚持这一个方向做,跟他说过的一句话有关。他跟我说,不管什么方向,你坚持做20年,再笨也是专家了。」马少平说。
采访张钹的时候,类似的故事出现过很多次。人工智能只在最近10年成为热点,在此前很长时间里,这是一个不容易找工作的专业。张钹帮助过很多像马少平这样对人工智能感兴趣的人,在技术寒冬依然坚持下去。我问他的动力是什么,张钹讲起了他自己的经历,这正是他从事人工智能的源头。
作为一个出生于1935年的人,他活在一个容易荒废天赋的时代里,亲历了战争、动荡、数十年的波折,他的天赋是物理和数学,但在他的年代,个人志趣排在时代命运后面。他的前半生都是国家替他选的路,先是当红色工程师,过了几年又要他去研究导弹和飞行器自动控制。1978年,他接到一个新任务,清华大学要调整院系,希望他为新调整的计算机系找一个新专业。他是在国外学术期刊里第一次知道,国外的计算机系都有一个方向,叫做「人工智能」。
那一年,他已经43岁,从零开始学习人工智能。事实证明,他的确是一个天才。他1982年到伊利诺伊大学巴纳·香槟分校(University of Illinois at Urbana-Champaign)访学,一年后就发表了第一篇顶刊论文,很快也得到邀请,参加国际顶级会议作报告。在美国访学期间,他与计算机系的同事有过接触,令他印象深刻的是,「当时系里有位著名的华人学者,也是计算机系的重要领军人物,得知我们同样在1953年考大学,他跟我说,我当年考大学不敢报清华大学,只好在香港念了大学,后来到美国读博士。我当时心里想,我们现在名气没你大,主要是因为我们受到了许多条件的限制,如果我们是一起出发的,我们肯定不比他弱。」张钹说。
1982年张钹访美结束,实验室的年轻老师和博士生特地一起聚餐为他送行,后排正面为张钹受访者供图
选择人工智能是他下的一个决心。相比于聊自己,他在访谈中更多谈到的是他人的聪明,他在清华认识的同学、老师,以及一代又一代的新生。他从一个荒废天才的时代走出来,而他在讲台上面对的是这个国家又一代的年轻人,他决心要帮助他们,不再偏离路径,摆脱那种辜负天赋的命运。
「我们还是幸运的,在1978年改革开放时,还算年轻,抓住了一点尾巴,能再次开启学术生涯,要是再晚一点,我们就什么也做不了了。」张钹说,「我自己当时到大学就深刻感觉到,我们招收的是最优秀的学生,能进我们团队做博士生的,是尖子里面挑尖子,所以我常说,我们团队如果不成为最优秀的团队,算怎么回事啊?」
这种坚持从张钹传递到了马少平,而已是博士生导师的马少平,也将这份原则传递给下一代学生。OpenAI最初公开ChatGPT的实验曲线后,马少平和学生讨论,这条曲线里其中一个性能做了很长时间都一直很平缓,突然间有一个跳跃,才确认出现了人工智能的进展。「我当时看着那个线,很多人都是这样,可能在很平缓的时候,觉得这条路走不通了,算了,不做了,这事没希望,又是一件这么烧钱的事,成本很大。为什么他们坚持下去了?是什么原因让他们想到,坚持下去肯定会有这次跳跃?」马少平说。
「我们在讨论实验室发展的时候,也都会提到这一点,就是一定做一个长远的事业,第一,对人工智能发展有意义,第二是有一定难度。这样里面有一个科研选题的问题,你有一个长期选题,但刚开始你可能又需要有一个相对短期的目标,跟这个长期目标契合。」马少平说,「重要的是坚持下去,坚持20年肯定能行,这是张钹老师一直强调的事情。」
最近两年的人工智能热潮中,马少平经常出去开会,有一次坐他旁边的是另一所同样顶级院校的计算机系系主任。两个人聊天,对方羡慕地说,其实我们学校本来也有好多在做人工智能的教授,后来都砍掉了,以至于现在整个系里边,没有一个老师是专门从事人工智能这方面的,基本上是断档了,只能重新找人,把那些转方向的人再找回来,或者再招一些新人,你们清华坚持得好啊,只有你们那边是一直在坚持做。
「实际上从1978年开始,我们一直以来都坚持着人工智能这个方向,我们一直没有断档,这是非常罕见的,也是最珍贵的。在90年代,其实很多国内学校都不做人工智能了,但那时候张钹老师一直觉得这是一个应该发展的方向,那时候他想得更多的是怎么能把它坚持下去。那时候我们的目标是,人工智能这个名称怎么叫咱不说,但是计算机的发展一定是,让计算机帮我们人类做更多的事情。这是必须的。」马少平说。
落地
清华计算机系有两大特色,一个是坚持,一个是落地。在培养人工智能人才这件事上,数十年间不断档,这很珍贵,也很艰难,也正是这份坚持,激发他们形成了清华代表队做人工智能的另一种特色——落地。
黄必清是人工智能在产业应用领域的专家。他从1990年开始跟张钹读博,是他招收的前10位博士生中的一个,现在是清华大学自动化系的教授,主要研究方向是人工智能在智能制造、健康医疗、社会治理等领域的落地应用。
「我读书的时候,大家凭自己的眼睛去看老师怎么做事,他的行动影响了我。」在我们的对话中,出现频率最高的词是「落地」,这也是张钹带给他的最大影响。「人工智能发展到现在,一定要落地,一定要在现实场景中应用,这是他的研究历程带给他的思想转变。他以前也是主要搞理论研究,逐渐转变开始重视应用落地。我正好在自动化系,我就跟张老师一起做,共同承担了很多事。这是非常有意义的工作。」
这段思想改变的经历发生在上世纪90年代,人工智能的寒冬期。黄必清上学的时候,人工智能是一个不那么受欢迎的专业,技术迟迟没有突破性进展,国外开始陆续裁撤人工智能研究,很多大学也砍掉了人工智能专业,当时在国内,尚未开展起来的人工智能专业也面对了巨大质疑。
「(那时候)我们这个专业名声不好——吹得厉害,拿不出好成果。懂的人、不懂的人,都出来说自己懂人工智能。普通人分不出来谁在不懂装懂,谁是专家。学生不敢出去说自己是学人工智能的,别人问起来,他们就含糊地糊弄过去,说自己是计算机系毕业的。」张钹这样形容上世纪90年代的状况。
这是困扰人工智能直到现在的一个根本问题——这个学科真的有用吗?
从美国访学回国以后,张钹提了一个建议,必须自己去做调查研究,看看国家有什么需求,看看现实是什么状况,到底需要怎样的技术。这后来成为他坚持了一辈子的技术原则,「不结合实际需求的话,技术肯定发展不起来」。
清华计算机系的老师们花了两年时间调研,张钹去了重庆的兵工研究所,也去了东北的兵工厂,在齐齐哈尔、哈尔滨、沈阳实地研究武器制造过程。调查后,他有了一个明确的结论——发展智能机器人。
那段经历让人意识到,有许多工作不应当由人类承担。给他印象最深的一幕发生在东北的兵工厂,他参观炮弹生产与安装车间,这是一项极其危险的工作。特别是安装引信的过程中稍有偏差,炮弹随时都可能爆炸。工厂的应对方法只能是把车间安排在山坳里,在安装引信的工位两边砌上水泥墙。不仅如此,炸药的毒性具有挥发性,他在制造炸药的车间遇到的工人,没一个人鼻子是灵的,长期在车间工作,严重损害了他们的嗅觉。
「我们当时一看,这些工作肯定要用机器人来代替,这是一个硬性需求,所以回来我就建议,一定要建立一个智能机器人实验室。」张钹说。
1985年,中国第一个智能机器人实验室在清华大学成立,一年后,国务院批准了《高技术研究发展计划(「863」计划)纲要》,智能机器人正式成为「863」计划中自动化领域的两大主题之一,张钹也成为了第一届国家「863」计划智能机器人主题专家组成员之一。正是因为张钹所在的清华团队早早选准了这个方向,他们在智能机器人研究上一直具有优势,很长一段时间里,清华大学计算机系同时是民用和军用机器人主题的组长单位,清华也引领了当时全国智能机器人的研究与开发。
1985年筹建智能机器人实验室,地点为清华大学中央主楼地下室临时实验室,左边设备是机械臂PUMA-560(国内购置的第一台机器人),左一为张钹受访者供图
作为张钹的学生,黄必清参与了「863」计划的课题工作,也从导师的身上学到了在人工智能领域做研究的原则。「我上学的时候他已经55岁了,一直像一个年轻小伙一样,爬楼梯都是两级一步,他的心态一直是很饱满的。他是一个洞察力很强的人,非常敏锐,能快速判断一个方向适不适合我们做。当时我们就让机械手去面对工业场景,比如让一条线从孔里穿过去,还有一些更困难的调度问题,你自己琢磨,根本不知道从哪里下手,但他总会想办法,给你一个快速深入的方向。他那时候出去开会也会带新想法回来,拿回来让我们去模仿这个任务做。」黄必清说,「原来博士期间学到的很多人工智能理论,我工作之后用到了企业里头。」
其中一个重要的尝试是汽车玻璃缺陷检测。和张钹一样,黄必清也是在现实需求中发现了技术的必要性。在没有机器辅助前,检查汽车玻璃缺陷的办法全靠人工,一个工人自己搬着一块玻璃用肉眼去看,这样做,一方面人工成本非常高,另一方面工作强度很大,人很容易疲劳,容易漏检缺陷。
恰恰在这样的问题上,人工智能可以提供一种非常有效的解决办法。黄必清跟同事一起到了工厂现场,根据汽车玻璃生产的现实状况,设计了一整套采集过程,如何安置摄像头,如何调节参数,然后设计一个专门的人工智能算法去识别缺陷——在1.5米乘以2米的玻璃表面,让机器自己识别,判断是否有缺陷,定位缺陷,还要对缺陷进行分类,是鼓了气泡、有划痕,还是印刷错误等等。
「我也做人工智能算法,关键是要解决企业的问题。这一点我跟张老师同感,甚至感受更深。我们在做技术应用的时候,一定要落地到一个行业里去,你要学习它的产品特色,学习它的生产制造过程,学习现场情况细节,方方面面都要了解的。」
黄必清做研究非常看重现场细节。他说,计算机视觉的算法数据高度依赖工厂环境,这意味着采集数据的摄像头放在哪里都是一门学问,采集的光源设计得不够细致,有反光、有折射,都会直接影响数据质量。纯粹的计算机视觉理论工作用的都是网上开源数据集,很少到企业实地去思考如何设计、如何采集正确数据,这也正是清华代表队做人工智能的不同之处。「不同行业对数据采集要求不一样,特定的生产环境也不一样,纯粹做算法、用现成的数据的人,肯定没有我们在企业、跟实际需求打交道的科研工作者体会得深。」他说。
黄必清已经在自己的领域工作超过30年了。读书的时候,他主要研究传统人工智能,比如智能调度,后来,他将智能调度的技术应用到工厂里,一直做企业的工业自动化、智能化的工作。从2013年开始,他也开始做深度学习方面的工作。「一个是传统人工智能,一个是现在基于深度学习为代表的连接主义的方法,我觉得两者同样重要。现在深度学习技术很火,但传统人工智能技术也不是说它完全没用了,它也能解决一些特定问题。我觉得不同的人工智能分别去解决不同的特定问题,所以大家要更冷静地对待深度学习这个方向。」
在我们的访谈中,黄必清分享了很多他所做的人工智能,都是跟现实场景息息相关的落地,除了利用智能视觉帮助汽车玻璃表面缺陷检测,他们还做了基于视觉的物流管理,给笔记本电脑做缺陷检测,跟中石油合作做基于深度学习的油井勘探,还设计了基于大数据的甲肝预测预警系统。他还有一项研究是和重庆疾控中心合作,利用卷积神经网络帮助尘肺病筛查,研究深度学习在尘肺病可解释分期诊断的应用。
这是一项他一直想做的事。纺织厂的工作环境里弥散着大量悬浮物,长期在车间,容易吸入肺内,会引起肺组织弥漫性纤维化,也就是尘肺病。由于尘肺片零期和一期判断难度大,人工阅片对医生水平要求很高,再加上疲劳阅片等因素,尘肺病非常容易出现误诊、漏诊的情况。但黄必清带领团队设计了一种尘肺病影像学人工智能算法,帮助医生对肺部影像进行初筛,减少假阳性,提高诊断效率。
黄必清说,这其实是计算机视觉里一个很经典的任务,用深度学习算法去定位和分类,道理和做玻璃缺陷检测是一样的——先在胸片上看到发病位置在哪里,定位可能有病变的位置,然后判断病变级别,判断是一级、二级、三级。而在这个过程中,深度学习的代表算法之一卷积神经网络有很大优势,非常适合这项视觉任务,应用场景广泛。
「我觉得这些工作很有意义,在实际需求的应用里总结提炼一些基础算法问题,反过来再推动我们的研究工作。我是有一点偏重的,要做应用落地。我们现在要做的工作,一定是要面向国民经济主战场,解决工业实际问题。」黄必清说,「现在有很多大模型,大家都在去拼指标,但是拼到最后它的应用场景怎么样?最后应用的市场产业需求到底有多大?能不能带出来一个产业?不要太追风,追风追到最后,大家都卷完了,最后也没有实际的应用意义。我这样说搞理论的不一定赞成,但我还是想能够做出一些有影响的技术和产品,能做出产业贡献的。」
1992年在清华大学博士、硕士生学术讨论会上受访者供图
选择
当你面对了足够多的人工智能专家后,一种强烈的感受是,这固然是一门高深的学科,充满了未知,但比起知识本身的变化莫测,更大的变数发生在人身上。同样要做人工智能,不同的人选择的方向不同,下的决心也不同,这也是张钹的学生在人工智能领域的珍贵之处——他们选择什么样的方向?以什么样的决心在坚持自己的原则?归根结底,他们想要追求的是什么样的人工智能?
最具代表性的故事,发生在张钹的博士生朱军身上。朱军申请成为张钹的博士生是在2004年,那是人工智能的低谷期。当时的计算机专业就业很好,但系里学人工智能的学生出去,都不往外说自己的专业,自我介绍只说前半截,「我是清华大学计算机系的」,后半句吞掉了,怕别人觉得自己学了骗子专业。
朱军恰恰是在这个时间点上开始学习人工智能的。给他动力的,是一堂叫做计算机组成原理的课程。这是一门全国大学里只要有计算机系就会有的课程,但只有在清华,它有一个独有的暑假课题,叫做「奋战三星期,造一台计算机」。它要求学生应用自己在课堂上学到的基本原理,一个人从头到尾把所有细节走一遍,自己去设计,从最初的指令集,到寄存器寻址,再到编译,再到流水线,最后把硬件烧出来,让系统运行起来,展示成一个可以工作的计算机。
这是清华计算机系的传统,也是张钹那一代老教授的共同信念——没有动手能力、不懂落地是不行的。
朱军的暑假,有一个多月都泡在实验室里,不断查资料,把心里的计算机设计出来。虽然这本身不是人工智能,但这个清华传统给了朱军一种信心。「我可以通过自己的努力,把一个完全不会的东西做出来,做完这个课题我就觉得,我应该尝试博士时做一些新东西。」他说。
跟着张钹读博的时候,张钹让他在微软亚洲研究院实习,他如愿找到了一个全新的兴趣方向,用概率机器学习的方法分析网页,抽取有效信息,也就是10年后备受瞩目的深度生成模型的前身。只不过,当时这还只是一个局限于学术研究的小方向。
带着自己造一台计算机的那股劲儿,朱军开始了新尝试。很快,他发表了自己的第一篇相关文章,首发在该领域最顶级国际会议上,这也是中国学者在这一领域的最初亮相。他也成为了最早开始研究机器学习和贝叶斯方法的人。由于他的研究非常超前,当时微软亚洲研究院组织这个主题的讲座,受邀做报告的他还只是实习生。
他的天赋为他赢得了很多职业机会。出国参加顶会的时候,在美国交流的时候,很多人都直接邀请他留下来。他是在计算机专业最强的美国卡耐基梅隆大学(Carnegie Mellon University)读的博士后,以当时的条件,他有机会留下来,事实上,这也是当时很多计算机系专业学生的选择。
但他选择了一条少有人走的路——博士后毕业后,朱军回到了清华,担任老师,继续在国内开展研究。
我问了他理由,他讲了好多细节。他喜欢清华计算机系的传统,学校的氛围,国内的机会,但最重要的理由,是张钹。他在提到张钹的时候,同时提到了很多次「自由」。张钹组的实验室给了他一种自在感,他们会促膝长谈,也会讨论职业生涯的真问题。
对话大多发生在张钹的办公室里。朱军直到现在还记得,当时张钹坐在对面告诉他,「国外知名导师的水平比我高,条件也比我这里好,你如果选择出国深造,我会全力帮助你。但是,如果你选择留下来,我会全心全意培养你,绝不辜负你。」
很长时间里,这样的对话是张钹职业生涯里的艰难抉择。他培养过很多人工智能的学生,帮助他们到国外更高水平的环境里深造,但渐渐,越来越多学生不会选择留在国内。他理解学生的想法,但也希望能有更多人才留下来。他有时候会被问到,为什么我们不能超越美国?中国为什么没有OpenAI?这个老人也有自己的无奈,「我带出来的是清华代表队,我很清楚,清华代表队是最好的,但是我的对手是世界代表队,不仅有全世界最好的人才,里面还有我们自己人。清华代表队能打得过世界代表队吗?」
他觉得真正把人留下来的办法是,给予学生尊重,确保给他们一个小空间,容得下失败,也容得下自由,让他们能成长。
「我留下是因为张钹老师对待学问、对待科研,有我非常认同的价值观,但更重要的,是他对于学生的尊重。他并不把学生当成一个劳动力,读博并不是帮他打工,他把每个学生当成一个独立的研究人员,给人空间去成长。这一点给我触动很深。」朱军说,「只要你足够牛,足够有能力,他会想尽办法帮你去创造条件,支持你实现梦想。」
上学的时候,朱军做的课题属于当时那个领域最前沿的新方法,叫做概率图模型。这是一个全新的方向,所以最初他找不到人讨论,只能自己在无人区摸索。张钹一开始对它并不熟悉,但是几周之后再见面,朱军发现,张钹已经很快掌握了,后来才知道,张钹自己把当时新出的专业书,还有大量相关论文,全都看完了。张钹本身就有数理背景,而概率图模型的根源又是数学和物理,他很快就抓到要义,开始帮助朱军一起讨论。
这就是让朱军选择留下来的关键原因。「上千页的英文专著,他比我更早读完了。一个功成名就的资深学者,还能这样深入系统去学习一门新知识,他是真正专业地在做学问。我整个科研生活里遇到他,到现在还能一直跟他一起做研究,讨论问题,一块儿学习,真的非常幸运。」朱军说,「他非常尊重大家的学术兴趣,又有了新东西,他愿意不断去学习,尤其是现在自己也当了老师之后,你会发现真的是非常难得。」
2011年,朱军回到清华任教,也留下来继续和张钹共同研究。现在的朱军,是世界范围内机器学习和贝叶斯方法的顶级学者。他提出的扩散模型高效算法,不仅在国际顶级会议上得到认可,还被DALL·E2和Stable Diffusion等明星项目采用。
如今,朱军的博士生也活跃在人工智能领域。2018年,朱军和自己的博士生成立了第一个创业公司,一家最早专注于解决人工智能安全问题的公司。这个方向选择就是受到张钹的影响,当时外界都在强调深度学习的强大,张钹带着学生论证,人工智能现阶段哪里发展得好、哪里不好。「当时讨论下了一个重要结论,人工智能在发展过程中,离不开的问题是安全问题,所以我们定位要做人工智能安全,让这个技术发展走得更扎实吧。」朱军说。
这在当时是一种逆风向的操作。那时候人们还在人工智能热潮里面,朱军他们得花很大功夫,反过来教育市场,此刻除了热潮,更要重视安全问题。
另一个更极端的例子是他和团队所研制的VIDU视频大模型,这是国内最早专注做多模态大模型的团队,这也是张钹支持他做的选择。他们在做一件十分超前的事。其实朱军团队提出底层架构的时间比SORA早,但因为国内习惯了跟随美国,「当时我们给大家讲,很多人会怀疑,因为那时候很多人不懂技术,大家一说大模型,都是指大语言模型,都是去对标ChatGPT,跟人讲视频大模型,很多人听不懂。但SORA出来以后事情完全变了,看见这个路线国外也在做,大家回头一看,原来你说的是真的,现在也愿意相信我们了」。
现在的朱军,还是有很多难处。但是他在跟我讲起这一切的时候,还是有像他刚开始「造一台计算机」时一样的热忱。
「我从来不怕被颠覆,有时候跟学生也在说,如果在我有生之年看到我做的东西被完全颠覆掉,我会觉得非常幸运,因为这意味着人类的知识进入另一个层次了。而且我相信自己的学习能力,新东西过去我能做,将来也能做,并不会为它焦虑。亲历一个领域的快速发展,能够不断刷新自己的认知,我觉得这是更宝贵的。相比之下,如果最后我老到退休的时候,看到自己只是发了一堆文章,只是数个数,我会觉得非常没意思。」朱军说。
新的决心
为了追赶人工智能前沿,张钹要求自己经常发表论文,这个习惯一直坚持到80岁那一年。学生们给张钹庆祝八十大寿,这位导师宣布,八十以后,不再要求自己发表论文了。马少平说,当时听完感觉松了一口气,导师终于能休息了。结果过了没多久张钹说,接下来还有新任务,他要去帮学生创业。
前几年张钹生病,住院动手术。手术做得很成功,住院却让他看到中国医学的落后。躺在床上,感觉病房里「哪儿哪儿都是活儿」,都可以改进。院长在查房的时候专门来探望他,跟他谈论病情,他跟院长谈感想:「中国医学的落后,比我们人工智能落后多得多!」
「我住院以后得出了一个结论,中国的医疗太落后了,所有的好药靠进口、好设备靠进口,先进的东西几乎都是外国人发明的,不是中国人想出来的!问题在于我们没有人去想,更没有人去做,因为它不是快钱,做完以后没有效益,知识产权也得不到保护,谁还愿意去下苦功夫?」张钹说,「生病的时候我下了决心,努力搞智慧医疗,把我国的医疗水平搞成世界一流。」
张钹有一个明确的目标,想要用人工智能提高医疗质量和效率。他介绍自己做医疗的代表学生叫做丁大勇,一个几乎查不到背景信息的人。和他见面前,我只能看得出他曾经在英特尔中国研究中心工作过很多年,细分领域是做计算机视觉。
我是在一栋全是创业公司的办公楼里见到他的,连这栋大厦的前台都不知道他所在的公司是在做什么。丁大勇身上有着和张钹一样的认真和严谨。在我们的谈话中,他提到了许多关于眼底疾病和糖尿病的数据,在我写作期间核实数据的时候,发现他在谈话中引用的每一个数据都是准确的。
现在的丁大勇没有自己的办公室,他和所有团队成员一起坐在大开间里。这家公司有三个主要的人工智能落地产品,一个针对糖尿病视网膜病变(Diabetic Retinopathy,DR),一个是多病种的眼底疾病识别,还有一个是专门针对青光眼的辅助诊断。
丁大勇是张钹在人工智能方向培养的第50位博士生,但现在的他说话时更像一个眼科大夫,他能详细讲解眼底图,熟悉拍眼底照时容易犯的错,还能在看到眼底照片时敏锐地识别到,哪张是容易误诊成DR的视网膜静脉阻塞,哪张是容易漏诊青光眼的眼底结构。他办公室里一整面墙的书柜里,放的几乎全都是眼科学相关的专业书。
跟着张钹读博士的6年间,他的主攻方向是图像识别,基于内容的图像检索。那时候他面对的大部分图像识别任务是关于人的日常生活,比如如何找出图里的猫和狗,判断篮球是否进篮。毕业后他的工作也都与计算机视觉相关。他本来可以在这样的工作里安稳地继续下去,直到他决心做另一件事。
改变他的是一个技术进步。他发现,深度学习算法在人脸识别的特定图像分类任务上的能力,超过了人类,他开始考虑图像识别的严肃应用,第一个想到的就是医学影像。
他跑去找北京协和医院的眼科主任陈有信,说自己想要做糖尿病视网膜病变的图像识别,还跟他讲解自己的技术路线——中国有超过1.4亿糖尿病人,其中最重要的眼部并发症,就是糖尿病视网膜病变,它已成为工作年龄人群不可逆盲的主要风险因素。大约有三分之一的糖尿病病人患有DR,按照治疗指南,他们需要每年至少做一次眼底检查,所以他想用人工智能改变这个行业,用深度学习的方法训练出一个模型,找专家标注眼底照片,利用计算机视觉领域的进步,实现机器辅助眼底疾病诊断。
陈有信听了以后,只说了一句话:「好啊,做这件事需要情怀。」
「当时我还没觉得这句话有啥意思,感觉就是短时间挣不到钱吧,但我们就是觉得,技术上我们肯定没问题,拿出好的产品,怎么怕不挣钱呢?现在回想,他当时可能是想提醒我吧,结果提醒完了发现这个人居然没跑,还自己扑上来,第二个礼拜还带了一个具体方案回来,他可能觉得既然你是这样的人,那我就把人都凑上,大家把这事干成。」丁大勇说。
陈有信动员了中国最优秀的50多名眼科医生,包括协和、同仁等医院的顶级专家,共同参与了一个23000多张眼底照片的标注任务。平时,临床医生参与科研课题,最好的状态也就是专家找一两个博士生支援,但这次是专家级别的医生亲自下场,他们在临床工作之外挤出时间读片,迅速完成大量标注。基于这些专家标注,丁大勇的公司训练出了一个专门用于识别糖尿病视网膜病变的深度学习模型。
后来丁大勇才明白,为什么这些眼科医生会这么在乎人工智能。糖尿病有明确的治疗共识,每一个糖尿病患者每年至少要进行一次眼底检查,但是在现实中,这件事情因为眼底科大夫太少而没有办法做到。眼底疾病十分复杂,只有300微米厚的视网膜分了10层,每一层的病变都反映着各种疾病的状态。然而,全国眼底专业的医生只有3000人左右,日常眼底疾病就已经忙不过来了,根本不可能专门去做DR筛查。不止如此,医生资源分布也不均衡,偏远地区甚至根本没有眼底医生,这意味着仅靠人的力量是不可能完成DR筛查的。这是一件有实际意义的事,也是一件的确需要机器帮助人去做的事业。
第一个模型做出来之后,丁大勇选择了一个数据集,请50名医生给予诊断结果,让人工智能也在上面跑,最后人工智能排名第五。也就是说,假如这个模型是一位大夫,和协和、同仁以及全国其他专家一起比赛阅片,它的诊断准确度排名第五。
就在他调试技术的时候,张钹给他的学生提了好多建议。丁大勇说:「他告诫过我,人工智能真正落地的时候,会受到医疗行业本身特点的约束,他跟我讲了三个特点,一个是它的专业性,一个是监管性,还有一个是政策性。我们国家医疗器械类的技术和产品都需要国家药监局审批,上市之前有严格的审批制度监管,政策性又很强,这都是我需要注意的。」
丁大勇是在现实中慢慢理解到导师的提醒意味着什么。他们的技术开发本身花了半年多的时间,但更复杂、更漫长的过程是技术以外的。医疗设备需要注册,连注册团队都听不懂他们的产品计划。这样的人工智能辅助诊断技术,国家药监局不知道怎么审,还没有审评指南,连审评指导要点都没有。丁大勇还为此专门跑去国家药监局,报告他们的研发过程。
也是在这个漫长的等待过程中,他开始明白医生提醒他的「情怀」意味着什么。第一个医疗器械三类证到了2021年才批下来,花了整整4年,那段时间负责注册的同事还跟他感慨,办公室外面的花一年又一年,都开好几轮了,证还没有办下来。因为没有证,投资人也在观望,谈的时候都说有意愿投,但注册证没下来,他就不签最后那个字。中间有段时间,他们只能到处借钱发工资。主创团队大都是清华计算机系的博士生,但他们当时的样子,并不像是清华最顶尖专业的毕业生状态,创业8年里经营困难,丁大勇的收入流水连办签证都办不下来。
这就是技术进步在落地过程中的真实经历。人工智能是一个充满未知的学科,教会机器本身是一个难题,而让机器能够真正帮助到人,恐怕是一个更大的难题。经历困境的时候,张钹会用自己的方式帮助学生,他找丁大勇谈过很多技术要点,跟他讨论未来可能的突破点,医学影像的先验知识怎么利用,还会讨论小样本问题。更重要的是,他会用自己的影响力帮助技术落地,让学生能够在寒冬中也活下来。北京协和医院成立了眼科重点实验室,他还专门去会上作了报告,跟更多人普及人工智能在医疗领域应用的必要性。
「张老师期待人工智能在医疗领域落地,他指的是能够对医疗带来一些改变,尤其是颠覆性的变革。他不是说一定要有我自己的一两个学生在这方面成功,更何况,怎么度量成功呢?公司上市挣钱了,就叫成功吗?就像我这样,即使现在还有困难,我们现在这样就不叫成功了吗?」丁大勇说,「我觉得成功第一要看我们做的事情是不是有意义,第二是我是不是已经尽力了,别的,还能求什么呢?」
他的努力开始陆续有了成果。这项产品的相关论文发表在了《Nature》子刊和很多顶级学术期刊上。2023年,它也获得了欧盟医疗器械(MDR)CE认证,成为了中国第一个获得此项认证的眼科人工智能产品。就在我们访谈前几个月,国家药品监督管理局批准了他们所生产的眼底病变眼底图像辅助诊断软件的注册申请,拿到了NMPA三类医疗器械注册证,成为全球第一款获批上市的能够支持10种以上眼底疾病的人工智能辅助诊断产品。它也已经在法国、德国等市场落地,进入国内1800余家各级医疗机构临床应用,累计服务患者超过了100万人。
访谈期间丁大勇最高兴的时刻,是他登陆系统后台查看实时数据,给我看当天这些AI系统的调用量。访谈当天的AI触发量是5945次,前一天是6293次,这意味着,这样数量的眼底照片经过机器辅助阅片,给出了诊断意见,而这样的阅片体量是任何一家三甲医院眼科没办法一天之内完成的。
「为什么我觉得这样做好?就是因为它能大幅度改善医疗不平衡,很多地方是没有配备眼底医生的,他们根本没有办法得到及时诊断,对于很多偏远地区,那些连眼底医生都没有的地方,技术的进步真的能救命。」丁大勇说。
告别的时候已经是晚上10点,丁大勇还留在办公室,他还需要赶一个第二天就要交的报告。其实在这一轮人工智能热潮出现后,拥有20多年计算机视觉经验的他有很多可能的工作机会,也有很多更容易的路,为什么他坚持选择了最难的医学影像?他想了想回答我说,因为太难了,其他人不会选。
他说起跟着张钹读博士的时候,有一次课题组开会之前,张钹看着他们感慨了一句:「像你们这么好的学生,其实应该去学医的,这个国家最聪明的年轻人,应该去为人类造福。」后来他听张钹的讲座,PPT里总有一张图,写的是黄必清基于医学影像筛查尘肺病。「他是从技术角度去讲的,但是我注意到那张片子在他的PPT里反复出现,说明他也相信这个的意义吧,所以我做医学影像这件事,我觉得它有一种神圣感,觉得它的意义足以承载我们的付出。」丁大勇说。
丁大勇身上有一种和张钹一样的韧性,也有一种只属于他们的使命感。他说起最早开始做调研的时候,触动他坚持下来的动机是一件很小的事:当时他去协和,跟医生请教眼底疾病,发现医生办公室角落摞着高高一堆病历本,他们做研究的方式是,医生们想到了哪个病人的案例,就从柜子里找登记簿,查到病历号,再去机器里翻眼底照片。这让他很受震动,那已经是2016年,那是全国最好的医院,但现实中的医学影像居然以这么古老的方式管理,让这个计算机系毕业生难以接受,也让他坚定了信念,自己还有很多事情需要做。
「我和张老师的想法一样,谈到人工智能,我是最谨慎的,它到底学会了啥?它到底能不能在很多情况下很可靠地工作?我一直保持怀疑,很多问题我觉得到现在都没有答案。但我的怀疑是理论角度的,不是应用的角度。人工智能发展到现在的水平,它能带来实际应用价值,这是毫无疑问的。」丁大勇说,人工智能的进步不止是体现在新闻里热议的大模型,很多更切实、更亟需的技术进步都还没有发生,这就是他要做的事。
一代又一代
还有几个月,张钹就要过90岁生日了,现在的他,依然经常去办公室上班。总要比约定时间提前到,是他一直坚持到今天的工作原则。走廊里碰到熟人,跟他打招呼常常是一句接近感慨的问句:「张老师,怎么还来上班啊?」在家里,连老伴儿也抱怨他,你年纪这么大了,还经常加班加点。
他准备过五花八门的回答,「人工智能太火了,因此有很多工作要做。」「我上讲台,就像演员上了舞台,兴奋不已。」他最经常说的理由是:「人工智能的魅力在于它还在路上,因此深深地吸引着我。」
只在访谈的中途,张钹说起了另一个理由——不甘心。
「我现在最主要的任务,是如何帮助企业、帮助政府做出正确的决策。我们有这么好的人才,大家这么努力工作,为什么我们老是做不好?很大的原因就是很多东西束缚我们的手脚,好多束缚都是因为做了不正确的决定造成的,太可惜了,从个人角度来讲,我们失去了好多时间,但我更着急的是,国家失去了好多时间。现在不能再折腾了,所以我必须要尽我所能,帮助大家认清人工智能当前的形势,让人们有一个正确的理解,去做正确的事情。」张钹说,「我能做的事就是这些了。」
为此,他还在身体力行地做很多事。他在很多场合为不同群体讲解人工智能的发展现状,他还带着团队访问过好几次清华长庚医院。2019年,清华大学人工智能研究院和精准医学研究院联合成立了智慧健康中心,张钹出任首席专家。和医生讨论的时候,张钹的发言还是一贯的「落地」原则,「比起关起门来研究技术,还是应该由临床医生首先提出需求,根据他们在工作中遇到的实际困难来开发技术」。
在清华大学人工智能领域博士生杨斌的参与下,人工智能专家和医学临床专家合作,共同提出了新的区域智慧健康医疗服务体系。其中有许多技术应用,尤其是在疫情期间,他们开发的智能听诊技术应用在14家武汉当地医院,后续也推广应用在三甲医院呼吸科室以及儿科听诊场景中。
「我给自己定了一个目标,在我彻底不能干工作之前,我要干三件事。第一件事,我希望我们团队的基础研究能够真正达到世界一流水平,这是我最想做的一件事……第二件事,我做智慧医疗健康,我们跟长庚医院合作,有一个小的团队,院长也很支持我们,这一点做得还可以。第三件事,我尽量去多做一些工作,帮助企业发展人工智能。」张钹说。
接近50年间,张钹和他那一代的清华老师一点点改变了现实,第一本人工智能的教材,第一堂「人工智能导论」课程,第一个实验室研究项目,他们在一个对人工智能一无所知的世界里,慢慢塑造了一个培养人才的小环境,形成了许多独一无二的教学传统。
在过去的数十年间,清华大学计算机系成为全国最出名的优势学科,而这里所输送的人工智能领域的毕业生更是最有竞争力的人才。清华大学在全球最权威的计算机科学排名CS Rankings中名列前茅,而张钹所在的计算机系人工智能方向,常年排在全球第一。
「最好的学生都到我这里来了,所以我也是非常珍惜他们。我觉得他们非常不容易,最聪明的学生选择了我们的专业,既然你选择了人工智能,我一定想办法把你培养好。人家这么信任你,到清华这里来,最好的年轻人交在我手里,我要好好待他们。」张钹说。
在这样的坚持下,清华FIT楼拥有了自己的气候,不管外界市场是热潮还是寒冬,他们渐渐形成了自己坚守的人工智能阵地。他们所追求的人工智能前景,依然是上一代老清华人留下的目标:一个对国家和历史有意义、真正能帮助到人的技术。
2024年,清华校庆那一天,清华大学成立了人工智能学院,首任院长由图灵奖获得者、中国科学院院士姚期智担任,张钹作为指导教师代表,也在成立大会上发言,参与了学院成立仪式。他们坚持了这所大学半个世纪以来的治学原则,尽管外界的热潮让很多大学都成立了相关学院,但在这里,人工智能的培养体系,是只在研究生及以上的阶段开展,本科阶段学习的,依然是计算机基础知识。所有既往传统都不变,一个人还要先学习扎实的物理、扎实的数学,面对现实场景应对问题,这是清华人面对人工智能的原则。
「我从最开始研究人工智能的时候,就是从最根本、最基础的信息开始,从数学开始,把它的机理完全理解。大家以为OpenAI是2018年做出来了ChatGPT,实际上,人类花了六七十年的努力,才走到了今天。现在用的神经网络是什么时候开始研究的?1943年。也就是说,人类花了74年时间,才得到今天的Transformer模型,这不是一天、两天做出来的。你要每一项研究都做得很深很深才有可能走得到今天,大家不要以为说,今天看到了结果,好像很简单,实际上里头是人类经历过反反复复的琢磨、试错,在不成功后又经历了六七十年的努力,才得到了今天的结果,不是一夜之间做出来的。」张钹说,「现在的问题是,这些工作都是外国人首先做的,我们只是在人家做出来以后跟着做。所以我常常说,千万别听那些不负责任的宣传,说我们在人工智能方面跟外国已经差不多。怎么会差不多呢?在人工智能六七十年研究过程中,仅就ChatGPT而言,就有十几项的重大创新,所有这些创新几乎都是外国人提出的,这说明我们的创新能力不足,尤其是从0到1的创新能力很差,不解决这个问题,我们是很难赶超人家的。」
张钹说,这件事有个希望,「做两件事就可以」。「第一件事跟大家没关系,是我们高校的任务,即加强基础研究,提高创新能力,培养有创新精神的人才。第二件事需要大家一起干,就是坚持走开放的国际化道路,聚天下英才而用之。要把人用起来,不做到这一点,是很难达到世界一流的。」
说起这两点希望的时候,这位将近90岁的老人的声音里依然洋溢着年轻人一样的乐观,「趁我现在头脑还很清楚,一定要多做工作,不然人活着还有什么意义呢?」
跟张钹告别之前,我们聊起了时间对于人的意义。他笑着讲,他年轻的时候近视,衰老后视力又恢复了正常。他开始研究人工智能时已经43岁,一个大部分人难以重新开始的年纪,但他依然抓住了时间的尾巴,「算是完成了我的目标吧」。他也是在69岁那一年学习开车,「(当时的规定是)之后不让考驾照了嘛,我赶紧学了车,开了10年,很开心。」在他的人生经历里,只要抓准本质,不犯方向性错误,重新开始,从来不是一件错事。
这也是我们的访谈中他留给清华同学的叮嘱:「千万别跟着潮流出去乱说。」一定要把实际情况搞清楚,从现实出发去做事。
从FIT楼的办公室出来,张钹一个人沿着小路,往家的方向走去。一墙之隔外,就是清华科技园,在那里,依然每天上演着人工智能领域的起伏,热潮与低谷,成功和失败,周而复始地出现。路上很少人认出这位白发苍苍的老教授,他并不是墙外面人工智能热潮里的明星,但他留下的影响将延续很久,留在他和他的清华代表队身上。
(杨斌、袁进辉、裴得利对本文亦有贡献)
TOP STORIES
相 关 推 荐