2020年是黄学东加入微软的第27年。这位微软语音识别技术领域里的老将,在新年伊始有了新头衔——微软全球人工智能首席技术官,全面负责微软Azure云、人工智能(AI)的工作,包括语音、机器翻译、计算机视觉、自然语言和人工智能认知服务。
根据最新任命,黄学东将领导新统一的AI认知服务工程和研究团队。黄学东领导了认知组织的语音和语言团队。据悉,未来,认知组织中的语音和语言以及计算机视觉团队将移至AI平台并向黄学东汇报,而AI平台组织中现有的Form Recognizer,Personalizer和其他认知服务工程团队也将向黄学东汇报。
从履历上来看,算上大学时期的研究,黄学东在人工智能领域里已经坚持了30多年时间。黄学东祖籍湖南,15岁时,他便参加了高考,考上了湖南大学计算机专业。湖南大学的本科学习结束后,黄学东北上来到了清华大学念硕士和博士。在清华,黄学东学习了5年时间,完成了硕士学业,但博士没有读完就“跑”了。原因是,当时在自己导师的鼓励下,黄学东提前到了英国的爱丁堡大学学习,并在该校获得了博士学位。
2017年,黄学东被评选为微软技术院士(Technical Fellow),这代表着微软技术人员的最高荣誉,获得这一荣誉的人还包括图灵奖得主Butler W Lampson、Charles P. Thacker等。值得一提的是,黄学东也是微软首位华人技术院士。同时,他也是国际电子电气工程师学会(IEEE)和美国计算机学会(ACM)的双科院士,微软认知工具包CNTK的缔造者之一。
担任微软首席语音科学家期间,黄学东领导的语音和对话研究团队取得了多项里程碑式的成就。
2017年8月,在黄学东的带领下,其团队在产业标准Switchboard语音识别基准测试中实现了对话语音识别词错率(word error rate,简称WER),低至5.1%,创造了当时该领域内错误率最低纪录,首次达成与专业速记员持平而优于绝大多数人的表现。
2018年3月份,黄学东带领的团队在机器翻译领域拿下一项里程碑式的成就:其研发的机器翻译系统在通用新闻报道的newstest2017中译英测试集上,达到了人工翻译水平。这是首个在新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统。
2019年,在斯坦福对话式问答任务中,微软机器阅读理解系统刷新记录,成为目前排行榜上唯一一个模型分数超过人类分数的团队。
黄学东在接受澎湃新闻采访时曾表示,他的最终梦想是能让机器理解人类的语言,并让机器能够像人一样说话、交流。