王蕴红:好奇的心灵爱创新

2021-01-05 14:25 作者:高岚岚 来源:《中华英才》半月刊
大字号

626076
2013年获得中国青年科技奖

北京航空航天大学计算机学院副院长、智能信息处理研究所所长,承担着多项职务的王蕴红,不知她娇小灵活的外表下蕴含着怎样的能量,使她总是能够在模式识别、智能监控相关科研领域独树一帜,潇洒地行走于风云变幻的计算机学科前沿。

在审阅项目申请或听报告时,王蕴红会遇到这种情形:有些年轻学者一张口就说,我们跟国际上差得还很远。王蕴红分析说,“其实事实并非如此,在一些领域上我们确实存在差距,但是也有领先的地方。例如在身份识别、智能监控这些计算机相关领域,我国人口基数大、互联网应用多,实际所遇到的应用和理论问题有时更早,我们要敏感地发现问题,提出问题来做。”目前比较重要的国际会议和国际杂志中,华人学者扮演了非常重要的角色,王蕴红自己就是一家国际上广泛认可的信息安全类杂志IEEE Transaction on Information Forensics and Security(信息取证与信息安全汇刊)的编委,在计算机学科国际权威学术期刊和会议上发表论文200余篇,论文在Google Scholar(谷歌学术,下同)上被国际学者引用近万次。

她认为,一方面我们要具有清醒的头脑和自信的态度,不要妄自菲薄,增加自信心;另一方面要提高对自身做研究的质量要求,对自己的要求不是追赶国际前沿研究,而是应该站在前沿。立足于国家科技发展和人民生活需求,做脚踏实地的研究,是王蕴红贯彻始终的科研态度。

如果在见到王蕴红之前,记者脑海中对于做科学研究还存有“枯燥、深奥”这样的刻板印象,这种偏见的概念在与她交流过后被彻底地颠覆了,提到科研,王蕴红使用频率最高的词汇是:好奇、有意思、兴奋、乐趣。她思维活跃,充满活力,总是喜欢关注有新鲜感的事物,痴迷于创新和创造。

既是研究者,同时为人师,王蕴红喜欢跟学生交流,愿意把自己的经验感悟传达给学生。她以独特的人文视角看待教育,在教学中因势利导,循循善诱,用“看得见摸得着”的生动形式引导学生认识科学研究的乐趣所在。

童年的滋养孕育好奇的萌芽

祖籍河北唐山的王蕴红在古都西安长大,父亲是一位电子技术工程师,从小父亲就常常问她和弟弟各种各样的问题:“为什么过马路的时候要先往左看后往右看?为什么上楼梯累下楼梯就不累呢?”王蕴红和弟弟自幼聪慧,再多问题也难不住他们,总是争先恐后回答。王蕴红在自由的状态下成长,那个年代没有辅导班,她喜爱并得以涉猎各类书籍,家里常年订阅《航空知识》杂志,虽然不一定读懂,但充满好奇心的王蕴红依然看得有滋有味。

王蕴红始终记忆犹新的是,上世纪70年代,父亲自己亲手做了一台电视机,小朋友都到家里来看电视。“只见父亲拿电烙铁把电子元件一点点焊接在电路板上,打了一个木头的箱子,把显像管和各种板装里面,不断调试,最后看到画面,听到声音,感觉挺震撼的。”

去年王蕴红参加的一次由中国科协组织的“明天小小科学家”的中学生和青年科学家面对面活动,其中有人问道:是应该遵循自己的兴趣,还是遵循自己的优势特长?王蕴红讲道,其实两者是分不开的,当你做什么事情很高兴,并能取得很好的成绩,说明你在这方面是有一定特长的,越做是让自己越来越快乐的一个过程。这是一种正反馈,每个人都应找到自己有成就感的方向。

深耕虹膜识别研究领域

1998年,王蕴红博士毕业前夕,对科研正好处于非常兴奋、难以割舍的状态,希望毕业后继续从事深入的研究工作。尽管拥有多项选择,其中不乏国外高校和实验室,而到中科院自动化研究所模式识别国家重点实验室参观时,王蕴红通过深入的了解和交流,感到这个实验室的学术环境非常国际化,在计算机视觉领域的很多工作是国际前沿的工作,因此最终选择来到模式识别国家重点实验室。

到模式识别国家重点实验室后,恰逢谭铁牛院士从英国归来不久,开展虹膜识别研究,王蕴红便加入其中。起步艰难。由于率先在国内开展虹膜识别研究,没有设备,没有相关的算法,几乎一切从零开始。在申请从美国的一家公司购买虹膜录入设备时,他们被告知,该设备属于高科技产品,对中国大陆禁运,于是他们着手自己制作录入设备。仅仅为了做虹膜录入设备,他们就翻阅了大量文章,查遍了所有原始资料。成功设计制作出第一代录入设备,可以建立虹膜图像库的时候,他们马上向全世界共享了这个图像库,此举不仅为中国高校、科研单位的研究人员奠定了更加容易进入的基础,也在世界范围内促进了该领域研究水平的提升。最新数据显示,已经有8000多个研究组应用这个图像库进行了相关的研究,是国际虹膜识别领域最具影响力的数据库。

之后他们在理论和算法上逐步进行了深入的研究,2003年,MIT Technology Review(MIT技术评论)评价说,他们的研究是在虹膜识别领域最好的工作之一,在识别率上达到了非常高的准确率水平。业内人士深知此番评价的分量,因为早在1993年,英国的约翰·多克曼教授已经将虹膜识别研究工作做到近乎完美,识别率已然高不可及,令人难以超越的程度,在之后的近10年时间内,模式识别领域最顶尖的期刊上没有出现虹膜识别的研究论文。王蕴红和团队的工作从很多不同的角度研究了虹膜特征的可区分性和稳定性,并给出了多种特征识别方法,随之有很多学者沿着这样的思路展开研究,引起了虹膜识别研究的小高潮。2005年,虹膜识别研究获得了国家技术发明二等奖。直至目前,每年发表在主流的模式识别期刊和会议上的论文还在引用他们的文章,其中两篇虹膜识别方面的论文在Google Scholar的引用次数都达到1000次以上。王蕴红2002年发表在《自动化学报》第一期的论文“基于虹膜识别的身份鉴别”,在2013年被评为“自动化学报50年最具影响力论文”。目前他们的研究成果已转化为产品,在身份识别领域大显身手。

尝试一条不是所有人都要走的路,不是从简单入手,马上就能看到结果,而是需要克服重重困难,潜心钻研,最终达成目标。此番经历带给王蕴红的体会是,要着眼于国家社会需求,坚持做有应用价值的研究。

做科研是王蕴红成就感的一部分,她也喜欢跟学生在一起,在教学中体验乐趣和成就感。2004年底,王蕴红回归校园,在北航成立了实验室、研究所。她以前瞻的视野,切入的研究点不断引领潮流。

创新进程的每一步都脚踏实地

做科研最难的第一步是提问题,把问题找出来本身就是一个创新性的过程。将学术前沿与国家需求结合在一起,选取理论上值得研究或应用中遇到的瓶颈问题,王蕴红不断开拓着新的研究领域和研究方向。

626078
土耳其开国际模式识别大会时与以前的学生相遇

王蕴红介绍,计算机识别事物的方式与人完全不同,计算机使用的更多是基于学习的方式。如果想让计算机认识一把椅子,需要给计算机学习各式各样椅子的图片,再有一把椅子出现的时候,计算机才可能能够识别出来。对于人类,一个人也许只见过几把椅子,之后即使见到设计得很艺术或者很怪异的椅子,也会知道那是椅子,而这恰恰是计算机所不能做到的。

人的视觉是什么样的?能不能把人的视觉借鉴过来设计计算机可实现的计算模型,这是多年来很多研究者都曾考虑过的问题,但是因为难以对人的整个行为去建模,所以只得知难而退。

王蕴红考虑到,人类感知事物的时候,是视认知、脑认知都发挥重要作用,能不能分开进行建模呢?正好她与复旦大学的视认知团队有一个973项目的合作,他们进行了深入的研究。

从哪里开始着手?在没有任何先验知识的时候,怎样去描述一个物体?研究团队的思路是,通过生物学角度,把视觉感受野上的视细胞功能进行建模,进而扩展到计算模型,设计图像描述子,作为图像的底层特征描述。实验证明,这样建立的描述子的图像特征区分性和稳定性都很好,但是它有什么规律呢?王蕴红和学生从数学上研究了它与小波的关系和对称性,运用数学框架进行了诠释,从而证明了该描述子具有特性,并提出了小波紧框架来构建描述子均具有良好的可描述性、可区分性和稳定性,这样描述的图像特征用来识别的话具有很好的识别性能,他们在国际通用的数据库上对这一结论进行了测试,获得了比其他描述子都优越的识别效果。

艰难的探索虽然获得了结果,但这些成果并不能马上得到承认并进行发表。如果单纯从发表论文的角度,对现有的某个模型有所改进是很容易发表的,因为大家都已认可。之前很多成熟的描述子,是计算机科学家提出来的,王蕴红和研究团队用生物学概念提出来的描述子要想在计算机杂志上发表,必须证明比现有典型的已被广泛认可的描述子性能还要好,才能被承认。

审稿人提出了大量意见,要求完成各类实验,不断要求对理论的各个部分做清晰的解释。为此,王蕴红和她的团队用了将近两年时间,对所有的要求和质疑均做出了无可挑剔的回复,在方方面面证明了其研究发现具有目前最好的性能,论文才得以发表。在论文发表时已经证明,王蕴红他们科研团队提出的描述子,具备非常严格的生物学依据,比现有的描述子数学理论基础和生物学理论基础都更扎实,取得了更好的识别效果。

以灵敏的感触不断引领学术潮头

王蕴红和她的团队近年来的研究方向一直围绕“以人为中心的视觉信息处理”展开,包括利用人的生理和行为特征进行身份识别、分类(性别、年龄)、行为分析、事件分析、智能监控等等。

在多层次的以人为中心的智能监控的系统里,需要克服的技术问题中包括多视角的问题,假如一个人从这个摄像机下走到另一个摄像机下,依然能够把他找出来。从应用上看来非常自然的一件事,在图像处理或识别里面却是比较大的技术问题。王蕴红解释,同样看一个人脸,对于计算机来说,它能看到的是不同灰度的分布,只是由一系列点组成的灰度值,如果光线等条件发生变化,整个图像的灰度值全变了。同样一张脸,有表情的变化、有旋转或者戴上眼镜等,从计算机的矩阵值来看就更不一样了。依然是那张面孔,如何进行确认,从特征提取的角度,需要找到不变性的特征。寻找到无论在什么环境条件下,都能代表本人的人脸特征,即鲁棒的特征,是研究团队攻克的人脸识别研究中又一个主要难点问题。

不盲目跟随,解决理论和应用中的切实问题,王蕴红坚定地表示,这是研究者的责任和义务。

在二维人脸识别备受关注时,王蕴红和她的团队早在2005年便已开展三维人脸识别的研究。尽管受限于当时的计算和存储等条件,但她以其灵敏的感触,已经意识到该项研究的价值。他们打破了原有的直角坐标系研究框架,开创了更符合人脸特点的“基于球面坐标的三维人脸识别”研究体系,提出了一整套相关理论。

在步态识别方面,王蕴红和团队在国际上较早进行生物特征属性信息分类的研究并形成了具有学术价值的研究成果。之前的很多研究关注着在远距离通过走路的姿态来判别人的身份,即此人是谁。但应用部门更需要有用的线索,包括性别、年龄、种族等信息,例如寻找一个亚裔的中年妇女,调取一段长的监控视频,通过这些信息,很容易找出相应的嫌疑人。然而表征一个人的身份特征与表征一个人的属性特征,有效特征是不一样的,一系列的理论问题最终全部被突破。

该领域研究者发表在2013年、2014年的多篇国际期刊的论文中都引用了他们的科研成果,并评论说王蕴红团队在步态识别方面的研究代表了国际上性能最好的工作之一。

巧妙的教学艺术激发学生探索潜能

王蕴红认为,本科生阶段对科研的好奇心是最旺盛的时候,需要引导和保护。在课堂上,她会经常抛出问题,引发学生思考,应用所学知识。通过提问,使学生们在解决问题的过程中,体会越来越多的成就感,从而激发他们的探索兴趣。

“很多东西必须通过他们自己思考和动手做,才能够把知识完全掌握。在课时有限的情况下,我依然要求他们能写成技术报告这种大作业的形式,然后讲出来。要会把自己的思想表达出来,让别人接受,这种能力其实在职业生涯中非常重要,但在我们的教育环节里边,往往容易被忽视的。”王蕴红非常注重锻炼学生自身扎实的能力,她解释,表达能力很重要,不管以后做研究还是去公司,会讲会写报告,职业生涯才能顺利发展。

保护学生们的探索心,王蕴红认为这比强调知识点和背公式更有意义。她承担的专业课程带有一定研究性质,除了教授基本方法,她会让学生们看到,在这些方法里的任何一点改进都可以成为小小的一个创新点。例如同样运用图像处理方法,简单使用方法可以看到结果,如果往下做也能做得很深,可以有很多创新性的工作。王蕴红向学生们展示了一个开放性的领域,只要愿意深入,总是可以挖出东西来。

通过有效的引导,王蕴红欣慰地说,学生们经常会给她带来惊喜。记得有一次,只让做一个简单的图像处理算法,有个学生交了一套产品级的作业,算法、界面等全都包含在内,简直像公司的产品。布置同样的问题,可以发现每个学生不同的特点,有的喜欢做开发,有的则喜欢做推导。

王蕴红认为,学生受到跟她相似的年龄群体的影响比师生的影响要大得多,有时候比老师灌输的学习效果更好,因此她营造充分的条件让学生们互相之间学习。“同样的问题,每个学生从不同角度来看,我让他们去展示的时候,让其他同学都可以看到,可以从多少丰富的角度去考虑问题。看到同龄人能做到,他认为他自己也应该能做到。”

在模式识别课里,王蕴红把一个知识点讲完,以小组为单位布置去做,然后上讨论课。每个小组都会挖空心思让自己小组超越别人。本来布置的是模式识别里一个基本的理论问题,但是他们都想通过应用来展示,同样一个理论,他们都找了不同的展示。有一个小组做的是手写数字的识别,有的做新浪账户正常账户和僵尸账户的识别,还有的用在了人脸识别效果上。在竞争的氛围里,每个组都希望展示自己最亮点的工作,充分发挥自己的创造力。

立己达人 播撒人文关怀

谈到发起“教授有约”活动的初衷,王蕴红认为,大学之所以为大学,不是因为有大楼,重要的是人文环境和氛围,对学生各方面养成的培养非常重要,和教授的交流应该成为大学文化的一部分。

626075
ICB2016国际模式识别大会最佳POSTER论文

考虑到本科生跟教授接触的机会较少,通过“教授有约”活动,他们和教授可以近距离接触,坐在一起聊天。没有固定的主题,通过轻松随意的交流方式,学生们可以问各种各样的问题,包括专业问题、教授经历、遇到的困惑等。

活动取得了热烈反响,尤其对于大一学生,他们之前对学校和专业的认识比较粗浅,活动有利于他们快速融入大学环境,了解专业前沿知识,帮助他们明晰自身定位,形成积极的世界观。

王蕴红一直跟学生强调,在研究的很多方面,我们是富有竞争力的,“我觉得自我暗示对青年人很重要,有些同学并不是能力问题,而是不敢做。中国人发英文文章在英文上是要吃亏一些,但是在思想上一点都不输给别人。博士生有能力在国际A类会议上发表文章。”A类会议是中国计算机学会评定的最顶级国际学术会议,录用率一般只有百分之十几,基本不超过百分之二十。

王蕴红经常跟博士生说,不要国际上什么东西热就跟风做什么,不能唯文章论,做研究的目的不是为了发文章,而是为了解决问题,这个出发点要一直坚持。“如果没有任何自己独创的内容,也没有解决理论和应用问题,只是把别人的方法性能提高了百分之一点点,我觉得没有意义。”

根据每个学生不同的性格特点,王蕴红注重因材施教。她经常问学生,“你的职业规划是什么?人生规划是什么?”她会把个人特点和个人规划结合起来,安排相关研究方向,给予学生最好的提升机会,让他们离自己的人生目标越来越近。

曾有一名硕士研究生,觉得自己不太适合从事计算机编程等技术类的工作,王蕴红跟他讲,不管以后做什么,必须在现阶段证明自己的能力,才能有以后的机会。他觉得颇有道理,毕业后在惠普公司工作期间,尽管不是很喜欢当时的工作,但依然非常敬业地去做,并在过程中收获很多。后来离开惠普公司与人合作创业,取得了不俗的成绩。这个学生感慨地跟师弟师妹们说,“老师说的是对的,你们要用心来体会啊。”

王蕴红希望能够在关键的时候,用自己的经验来帮助年轻的学生,帮他们理清思路,尽量做对他们有益的选择。

做研究会有失败的时候,总是会遇到与原有假设不一致的地方。王蕴红认为,碰到困难是暂时的,她总是有信心攻克艰难,她酷爱那种挑战性。而这正是源于拥有自由翱翔的心灵,一颗永远充满好奇的心!

人物简介

王蕴红,1968年12月生,教授,博士生导师,北京航空航天大学计算机学院副院长, 2013年中国青年科技奖获得者,中国计算机学会理事,中国人工智能学会智能交互专业委员会主任,IEEE高级会员,IEEE Transaction on Information Forensics and Security(信息取证与信息安全汇刊)编委。研究方向为模式识别与图像处理,在三维人脸识别、步态识别、虹膜识别、多生物特征融合、信息隐藏及检测等方面取得重大技术成果。获国家技术发明二等奖1项、北京市科学技术一等奖1项, 2000年被科技部授予863计划先进个人,2005年入选教育部新世纪优秀人才,在权威的国际国内学术期刊和会议上发表学术论文228篇,在Google Scholar上被引用九千余次。作为负责人已主持国家自然科学基金、863计划、973项目课题等国家级项目17项,2012-2016年5次担任中国生物特征识别大会主席、2013年中国计算机学会人工智能会议程序委员会主席,作为程序委员会委员、区域主席等组织国际模式识别大会、国际生物特征识别大会等国际权威学术会议30余次。

(2016.07.16 第14期)