报告题目:面向工业操作场景的视频行为分析
报告人:鲍秉坤
报告时间:2026年3月11日(星期三)15:00
报告地点:科技楼324
主办单位:电子信息与人工智能艾弗森贝博ballbet体育
报告人简介:
鲍秉坤,南京邮电大学计算机艾弗森贝博ballbet体育、软件艾弗森贝博ballbet体育、网络空间安全院长,国家杰出青年科学基金获得者。研究方向为多媒体计算、计算机视觉、人工智能等,主持国家科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点项目等。担任IEEE TMM、IEEE TCSVT、ACM TOMM、PR编委。
讲座摘要:
视频行为分析旨在通过从连续的视频序列中识别、定位和解释目标行为,实现上下文关联和语义理解。随着深度学习技术和大规模预训练模型的快速发展,现有行为分析研究在互联网、安防监控等领域取得了长足进步。然而,在应对工序繁琐长时、人-工具交互复杂、视角移动频繁的工业操作场景时,现有方法仍面临长时序处理效率低、异常辨识能力弱、在线预测准确率低等瓶颈。针对上述挑战,本报告介绍建立的“高效内容定位-鲁棒异常检测-精准未来预测”三阶段技术体系:首先通过语义驱动的历史行为摘要,快速产生行为实例候选片段,支撑长程时-空跨度下高效行为定位;然后引入预训练视觉-语言模型提供语义知识,提升对未知异常泛化能力,实现面向长时工序的鲁棒异常操作检测;随后利用高阶意图线索引导挖掘历史-未来行为间关联,实现面向装配操作的在线行为精准预测。报告最后将探讨面向工业场景的智能体行为决策的研究趋势。



