国际影响力
2020-2025连续6年入选爱思唯尔和斯坦福大学发布的全球前2%科学家榜单,2024-2025连续入选科睿唯安(Clarivate)全球高被引学者(全球千分之一)。谷歌学术引用超过12万次,在模式识别领域排名中国大陆第一,全球第12。兼任 Neural Networks、Pattern Recognition等国际知名期刊副主编。
人才计划与荣誉
国家级人才计划领军人才
科技部中青年科技创新领军人才
上海市优秀学术带头人
中科院百人计划
2023年度王选杰出青年学者奖
广东省技术发明一等奖(第一完成人)
CVPR 2023最佳论文奖
AAAI 2021杰出论文奖
ACL 2024杰出论文奖
世界人工智能大会青年论文奖
吴文俊人工智能奖二等奖
中国科学院卢嘉锡青年人才奖
科研成果
1.深度学习领域成果
提出深度时序分割网络TSN,首次实现全视频端到端训练,成为该领域重要基准方法,相关被引6500余次。提出了多任务级联检测MTCNN、中心损失Center-Loss等重要基准方法,为人脸检测领域近二十年全球引用最多的论文,被引用7900余次;相关技术转移到华为、腾讯、商汤等领军企业,根据IDC统计,相关技术市场占有率全国领先。首次提出了中心损失以类内聚合度作为深度学习优化目标,显著提升了开集人脸识别的精度,是LFW上全球首个精度超过人眼的开源方法。
2.通用视觉大模型领域成果
提出并发展通用视觉方法,目标是实现单模型体系支持多种任务、多种场景和多种模态,体系化应对认知、效率、可信等瓶颈,推动视觉智能从单任务单模态可用到多任务多模态安全易用。2021年,领导研发了国内首个广泛覆盖多种视觉任务的通用大模型书生Intern,标杆任务性能同期国际领先。2023年,团队首次提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局规划为目标的端到端自动驾驶大模型架构,获得人工智能领域重要国际会议CVPR 2023的最佳论文(2/9155),为近十年来国内学术机构首次以第一单位获此奖。
3.多模态大模型领域成果
领导研发了“书生·万象”多模态大模型InternVL,提出渐进式预训练方法,探索以更少资源训练大模型的道路,2024年InternVL 1.0以不到300亿参数在多项评测中接近甚至超过万亿级参数GPT-4V的性能。在司南等同期评测中,书生·万象位于多模态开源大模型领先水平,打造OpenGVLab开源平台,GitHub总星数超5万,相关模型累计下载超过6千万次,通过开源开放实现广泛赋能。被中核集团、中国电信、宝武钢铁等采用,服务国家重大需求,入选工信部新型工业化典型案例。AGIC生成技术支持央视首部AIGC动画片“千秋诗颂”制作,全球受众超12亿,载入中国媒体编年史,获2024世界设计之都大会(WDCC2024)AI创新设计大奖。