中国财经之窗 - 财经信息聚合平台
中国财经之窗

模型“大”且技术“统一”旷视科技探寻基础科研新未来!

栏目:科技    来源:中国网    作者:安远    发布时间:2022-07-30 11:06   阅读量:14696   

在最近几天落下帷幕的2022年旷视科技开放日上,旷视联合创始人兼CEO殷琦表示,2+1AIoT核心技术研究体系是支撑旷视未来不断走向AIoT商业成功的重要基石。

其中,由基础算法研究和规模算法量产组成的AI技术体系是这套AIoT核心技术研究体系的重要组成部分。

在相当长的一段时间内,基础算法研究的工作对解放思想,实现认知升级和技术突破起到了极大的推动作用回顾计算机视觉的发展,不难发现每一代基础模型的突破都极大地推动了视觉AI的发展,促进了算法在更多场景的应用

在旷视,基础算法研究和基础模型研究,开发和部署的重担落在了旷视研究院基础模型组组长张翔宇及其团队成员的肩上。

张翔宇坦言一个好的基础模型对于整个系统的性能提升是决定性的怎样才能设计出高速高精度低功耗的基本模型培养自己的科研品味和研究方法,不断实现认知的突破和升级,是非常重要的

解放思想,开辟创新之路

迄今为止,张翔宇的成绩单相当亮眼在CVPR/ICCV/ECCV/NIPS/TPAMI等顶级会议/期刊上发表论文50余篇,被谷歌学术引用超过17万次,在ResNet,ShuffleNet,RepVGG等神经网络模型设计方面持续高效输出

在他的带领下,基本模型组每年都在一步步往上走,成功实现了组内一文一会的小目标CV2022,他们提出了基于大核的CNN和MLP的设计范式,包括动态卷积神经网络焦点稀疏CNN,,此外,他们还在ECCV 2022上发表了关于自动驾驶感知新网络PETR的初步工作张翔宇强调,PETR几乎没有人为的设计元素,但它处理基于同一架构的多视图,多时间,多任务和多模态输入

回顾这些在神经网络研究领域发挥重要作用的技术创新,我们不禁惊叹于他的研究团队紧跟商业世界发展脉搏的预测能力和前瞻眼光但把一切简单地归结于运气显然是不公平的事实上,得益于老师孙健博士的指导,他和他的朋友们总是试图找到那些反直觉的开创性认知,将其固化为知识,最终沉淀为技术信念

一旦你发现你以前从未想过的事情可以做到,它往往可以带来突破性的结果张翔宇以《变形金刚》和CNN的学术争议为例在模型设计上,学术界都在关注《变形金刚》和CNN的区别,争论到底哪个更好用但是我们看到了两者的相似之处我们觉得跟是不是变形金刚或者CNN关系不大,重要的是有没有大的感觉场同时也说明模型架构的优化特性往往比呈现能力更重要

沿着这个思路往下想,不难发现一旦模型统一,AI加速器的设计将非常简单,即一个模型可以应用于各种设备和任务,但它带来的挑战也是显著的例如,为了在多个任务上共享一个模型和一个算法,我们必须加深对这个系统和这个模型的理解,这样我们就可以抽象出共性,然后我们就可以用一个统一的模型来实现过去为所有系统分别设计模型的性能

这样的认知进步,就是科技创新之路的前奏。

阅读文学修养研究体系

「反直觉」从何而来事实上,突破性的发现在科研界是罕见的很多新事物不过是新瓶装旧酒,是过去已经发现的一些现象的另一种表现没有好的想法,很难发表论文,发现前人做过研究永远是研究者最头疼的问题

在基础课题组成员看来,碰运气是极小概率事件,根本方法是改变自己的先验知识,不断改变自己的思维。

要把分散在不同文档中的珍珠串起来,需要很大的努力在RACV 2021举办的讨论变形金刚的圆桌论坛上,张翔宇展示了一个非常严谨的大脑地图,引导观众跟随他的思维

饶是如此,有自己的想法,做点不一样的事还是要在实践中经历各种考验人工智能技术不断发展,修正和反思自己的技术信仰已经成为日常工作不仅要全面收集信息,还要知道目前的技术天花板达到了哪里,要自己做实验来验证,也就是有问有答正如张翔宇所说,有些关键技术总是一步到位,技术路线的选择总是有风险的

在刚刚结束的旷视科技2022开放日上,张翔宇明确指出大和统一是视觉AI基础研究的新趋势对此,他强调,忽略大的定义,是为了以创新的算法发挥大数据,大计算的力量,拓展AI认知的边界,但是,如果能够用统一的算法和统一的模型对各种数据和任务进行表示和建模,就可以得到一个简单,强大,通用的系统

坚持原创,做理想的实干家。

作为孙健博士的弟子,张翔宇坦言,自己的科研品味,科研价值观,科研心态乃至团队沟通合作能力,几乎都是向孙老大学习的正因如此,他一直认为,能够独立思考,拒绝盲目跟风,预测能力强,敢于决定研究路线,基本功扎实,知道怎么做才是对症的等等都是人工智能领域高端人才的必备素质

基本型号组的科研氛围,可能也就当是这些能力的实践版吧遵循计算机视觉的主要任务逻辑,基础模型组的研究方向集中在通用图像模型,自动驾驶模型,计算摄影模型和视频理解模型四个方面团队成员可以选择两种模式中的一种:参与项目和自由探索

项目有明确的时间节点,会定期回顾和跟踪进度更需要大家齐心协力,及时解决问题而自由探索则是基于团队成员自身的兴趣,充分发挥他们的主观能动性来选择课题张翔宇在小组中负责定方向和给细节,但他说,他更重要的责任是维持小组成员可以自由做自己喜欢的事情的氛围,激发每个人的创造力

在藐视技术开放日演讲的最后,张翔宇表示,基础科学研究将始终坚持原创,实用,本质的科研价值观只有实现原创,才能突破现有技术的认知边界,只有实用,才能真正将科研成果转化为产品,转化为实用价值只有发现本质,才能从众多表象中看到型号背后的创新,更好地实现大和统一的基础型号研发

这种说法符合迪法恩斯研究院始终奉行的技术信仰和实用价值的理念十年磨一剑,星星之火,可以燎原

最后,对于对计算机视觉研究感兴趣的年轻人,张翔宇也根据自己的经验和小组里的情况给出了四点干货建议:

广泛的知识积累大量阅读文献极其重要就我接触过的世界知名学者而言,没有一个人的阅读量惊人现在很多人搞科研不看论文,这是不对的因此,在基本模型组内,所有成员都必须参加每周的论文阅读,并按时提交解读报告

对问题的敏锐感觉在阅读大量原始文献的基础上,要有收集知识,发现问题的能力一篇有价值的论文,肯定有一些点是我的知识体系无法解释的,所以我会记录下来以后再看其他文献,一旦遇到类似或相反的情况,我会反思是因为实验做得不对还是隐含了以前没有意识到的细节,还是在这里是一种新的认知

扎实的数学基础扎实的数学基础可以提高AI研究的上限,但数学知识在毕业后很难抽出很长时间来补习因此,他鼓励在校学生努力打下坚实的数学基础为了防止忘记数学知识点,张翔宇每半年左右就会把本科水平的课本习题刷一遍,以保持感觉

纯科研心态无法消化论文产出压力而产生的焦虑,是大多数人放弃科研的主要原因但科研有趣的地方在于,从无知到理解,从无知到知识,论文只是这个过程的副产品,要保持科研的纯粹初心

2023迪法恩斯校园招聘进行中欢迎有意加入旷视学院的同学投简历,一起做纯粹的事情

热搜:技术,科技   
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。
模型“大”且技术“统一”旷视科技探寻基础科研新未来!