Banner
特别专题论文征集

 

 

特别专题(Special Session)是 PRCV 会议的重要组成部分,旨在围绕模式识别和计算机视觉领域中的新兴方向和交叉议题,组织具有针对性的小规模专题研讨。每个特别专题将聚焦一个具体主题,涵盖该方向中具有代表性的最新研究成果,以促进特定领域的深入交流和合作。

特别专题接受定向邀稿与公开投稿,论文将通过 PRCV 2025 官方投稿系统,选择对应专题会议选项提交,与主会议投稿采用相同评审标准和程序。被接收的特别专题论文将在大会上交流,统一收录于 PRCV 2025 正式论文集。会议论文集将由Springer出版社出版,并被EI和ISTP检索。

特别专题投稿

投稿截止时间:2025年7月10日 11:59 pm (UTC+8)

录取通知日期:2025年8月23日(和主会议投稿一致)

终稿提交日期:2025年8月31日(和主会议投稿一致)

 

投稿步骤:
1、 登录PRCV投稿网址: https://cmt3.research.microsoft.com/PRCV2025/Submission/Index
2、点击左上角“Create new submission”,选择“Special Sessions”
3、在“Subject Areas”处选择意向投稿的特别专题,其他论文信息的填写和主会议投稿要求相同,见https://www.prcv.cn/CN/CallforPapers/

多模态脑机接口:算法、集成与应用

多模态脑机接口是融合EEG、fNIRS、MEG、ECoG等多种神经生理信号及外周生理信号(例如EOG、ECG)的交叉前沿方向,能够综合利用不同信号在时间和空间上的独特特征,大幅提升神经解码的准确性、可靠性与用户适应性。传统的单模态脑机接口面临可靠性差、解释性不足等挑战,而多模态融合方法正逐步成为突破这些瓶颈的重要途径。该专题聚焦于多模态脑机接口领域所需的先进算法、信号融合技术和实际应用,致力于推动神经科学、医疗诊断、个性化健康管理以及人机交互等领域的跨学科协同创新,旨在搭建一个平台,汇聚神经科学、生物医学工程、机器学习和认知人工智能等领域的专家,共同探索并推动下一代多模态脑机接口技术的发展。

专题组织者
贾子钰,中科院自动化所
Roger Mark,麻省理工学院
王延森,微软亚洲研究院
周信良, 斯坦福大学

投稿系统对应主题
Multimodal Brain-Computer Interfaces: Algorithms, Integration, Applications

基于大型语言模型的多模态应用:从机器人到医疗与科学发现

近年来,大型语言模型(LLMs)从自然语言处理扩展到机器人技术、医疗健康和科学探索等跨学科领域,展现了推动社会进步的巨大潜力。本专题旨在探讨LLMs如何通过多模态数据整合与智能决策,解决现实世界中的复杂问题。在机器人技术领域,LLMs通过处理语言、视觉和传感器输入,提升人机交互与自主决策能力,例如在动态环境中实现精准任务执行。在医疗健康领域,LLMs结合医学影像和患者数据,优化诊断准确性、个性化治疗方案和医患沟通效率,助力医疗资源公平分配。在科学探索中,LLMs通过分析多模态数据集(如天文观测、生物实验数据),加速假说生成与异常检测,推动跨领域发现。

 

本专题的学术意义在于揭示LLMs在多模态模式识别中的创新应用,突破传统自回归模型的局限,探索非顺序生成与全局上下文建模的潜力。其创新点包括: 1) 提出LLMs在机器人、医疗和科学领域的统一框架,促进多模态融合;2) 展示LLMs在复杂推理与实时决策中的高效性;3) 探讨LLMs的社会影响与伦理挑战。对PRCV大会的拓展价值体现在:本专题将计算机视觉与模式识别的核心技术与LLMs的语言能力相结合,探索多模态智能系统在社会应用中的前景,促进跨学科合作。通过邀请机器人、医疗和科学领域的专家学者,专题将推动前沿技术交流,为PRCV大会注入新的研究视角,助力构建更智能、更普惠的社会技术生态。

专题组织者
刘东方,罗切斯特理工学院
邵壮,英国纽卡斯尔大学
赵俊涵,哈佛大学医学院,芝加哥大学
于开丞,西湖大学

投稿系统对应主题
Multimodal Applications of Large Language Models: From Robotics to Healthcare and Scientific Discovery

基于质量评估的可信 AI 生成内容

本专题聚焦“生成—评估”一体化的新范式,探讨如何将质量评估指标深度嵌入生成式 AI 流程,从而提升生成内容的可信度与可验证性。我们特别欢迎在模型压缩、鲁棒性评测、人机一致性对齐等方面的原创研究,以及面向医疗影像、自动驾驶、创意内容与关键决策场景的跨模态应用案例。议题包括(但不限于):生成式 AI 质量评估方法、可信 AIGC 技术框架、文本-图像质量度量、大模型评测基准与数据集等。期待与会者共同推动生成式 AI 的可靠应用与负责任发展。

专题组织者
郑侠武,厦门大学
张岩,厦门大学
闵雄阔,上海交通大学
袁粒,北京大学深圳研究生院

投稿系统对应主题
Trustworthy AI-Generated Content Based on Quality Assessment

视觉大模型的高效计算与跨域应用研究

近年来,随着ViT、Swin Transformer 等模型在图像分类、目标检测、语义分割等任务中不断取得性能突破,视觉大模型逐渐成为计算机视觉领域的重要研究方向。其在表征能力与泛化能力方面的优势,推动了诸多下游任务的进步。然而,由于模型参数规模庞大、计算与存储需求高、部署流程复杂等原因,视觉大模型在真实环境中的应用仍面临严峻挑战。


本专题将围绕视觉大模型的高效计算与跨域应用展开系统探讨,涵盖三个主要技术方向:一是高效计算策略,包括分布式训练框架、动态推理机制、模型压缩与剪枝、神经架构搜索等方法,旨在提升模型的计算效率与资源利用率;二是系统部署优化,聚焦模型在异构硬件平台上的适配与协同运行,涉及边缘计算、移动端部署与云端推理等场景下的优化设计;三是跨域应用实践,关注视觉大模型在智慧城市、医疗图像分析、工业检测等复杂任务中的可迁移性与鲁棒性,探讨模型在多源数据与任务间的泛化能力与适应机制。

专题组织者
霍华,河南科技大学
庞彦,中国科学院深圳先进技术研究院
孟庆洁,英国伯明翰大学

投稿系统对应主题
Efficient Computation and Practical Application of Visual Models

红外图像感知与智能处理

红外图像具有弱光适应性强、目标可穿透识别等独特优势,广泛应用于夜视监控、自动驾驶、军事安防、遥感测绘等关键领域。然而该技术仍面临一些挑战:如低分辨率和噪声干扰,目标信息较少,复杂背景干扰下的目标识别困境等问题,很难准确、快速地探测到远距离目标。近年来,随着深度学习与多模态感知的发展,红外图像在感知、理解与智能处理方面取得了显著进展,催生了红外图像增强、跨模态融合、分割、目标检测等多个研究热点。

 

本专题旨在汇聚该方向的前沿研究成果,探讨红外视觉感知与理解中的关键问题与创新方法,包括但不限于红外图像增强、红外-可见光融合、复杂背景下的红外目标检测与跟踪、跨模态语义对齐等。通过专题的组织,推动学术界在红外图像处理中的算法创新、性能优化与实际应用落地。通过推动算法创新、性能优化与实际场景落地的深度结合,本专题致力于构建产学研协作桥梁。诚邀图像处理、计算机视觉、多模态感知等领域研究者投稿高水平成果,共同提升PRCV大会在红外视觉研究的学术影响力,赋能国家安全与智能产业发展。

专题组织者
邓磊,北京信息科技大学

投稿系统对应主题
Perception and Intelligent Processing of Infrared Imagery

 

主办单位

中国图象图形学学会 (CSIG)

中国人工智能学会 (CAAI)

中国计算机学会 (CCF)

中国自动化学会 (CAA)

 

承办单位

上海交通大学 (SJTU)

上海飞腾文化传播有限公司


协办单位

AutoDL

官方微信公众号