当前位置: 首页 > 人才培养 > 研究生培养 > 正文

紧跟科技前沿 践行科研育人 探索未来发展

【发布日期:2023-11-01 | 来源:人工智能系、学科师资办 】


20231030日上午,南开大学计算机学院副教授李翔博士在北教14-S125举办题为“视觉理解:从网络到表征”的学术报告会。会上深入探讨了计算机视觉领域的前沿研究成果,吸引了众多老师和学生的关注。



本次报告旨在探讨计算机视觉理解领域的最新进展。李翔博士首先介绍了视觉理解的基本任务,包括图像识别、目标检测和跨模态物体定位等,并强调这些任务对于计算机视觉的重要性。报告详细介绍了两个关键方面:即主干网络和网络表征,以及最新的研究成果。其中,李翔博士着重介绍了三个代表性研究成果:受生物视觉启发的选择性核网络(SKNet)、高效的金字塔多尺度结构(PVT)、以及大型选择性核网络(LSKNet)。

在报告中,李翔博士强调了生物视觉的启发作用。他回顾了加拿大神经科学家David H. HubelTorsten Wiesel的研究成果,这些科学家发现猫的原始视觉皮层中神经元的局部感受野具有自适应性,随着环境刺激的变化而自动调整。这一发现激发了选择性核网络(SKNet)的研究,旨在实现视觉感受野的动态调配,从而提高神经网络的性能。

此外,李翔博士详细介绍了视觉transformer的发展,重点强调了金字塔多尺度结构(PVT)的架构和对小感受野局限性的克服。PVT的架构被引入到transformer网络中,旨在克服传统视觉transformer的缺陷。通过引入多尺度感受野结构,PVT能够更好地处理图像的多样性,提高图像识别的准确性。李翔博士的此项成果入围ICCV2021(人工智能领域顶级会议)Top-10最具影响力工作。

李翔博士还深入探讨了使用大模型对零样本语言描述定位任务进行视觉表征增强等方法,给出了高校师生如何参与到大模型等前沿技术研究中的示例。

李翔博士的报告汇集了计算机视觉领域的前沿知识,其在国际竞赛、产学研合作方面经验丰富,李翔博士同与会老师、同学充分交流互动,大家纷纷表示深受启发。

民航信息新技术论坛是计算机学院将科技前沿与学院高质量发展相融合的重要举措,迄今为止开展18期活动,旨在探索和实践科研育人的新模式,凝聚浓厚科研氛围,持续促进学风建设,推动计算机学院高质量发展。 (文字:刘才华 摄影:宋欣楠 )


Baidu
map