/

En

Topic Forum

*Click the link to jump to the corresponding position


青椒如何熬成老椒?

1.Theme

青椒如何熬成老椒

2. Purpose and Significance

本论坛旨在从科研选题、论文写作、科研合作、项目申请、声誉提升等方面为年轻学者提供指导和经验分享。

3. Schedule

Time: October 30 16:00 - 18:30
Location:第二会议厅(B+C)
Time Headline Speaker Host
16:00-16:20 面向问题的研究选题 刘成林 林宙辰(报告),王奕森(Panel)
16:20-16:40 如何写优秀的科研论文 王井东
16:40-17:00 “青椒”科研中的“合”与“作” 黄高
17:00-17:20 科研项目申请中的几点建议 韩军伟
17:20-17:40 声誉提升 陈熙霖
17:40-18:30 圆桌讨论 全部讲者

4. Proposed lecture content and introduction of invited speakers

Invited Report 1: 面向问题的研究选题
Summary:有价值的研究题目是面向问题或应用的:未知的理论、原理,通用模型与方法,或者应用中未解决的技术问题,因此都是 面向问题的。研究中的创新价值可分为四个层次:问题创新,理论创新,方法创新,技术创新,工程创新。人工智能领域的研究工作大多是方法和技术创新。 问题创新(新问题、新场景)当然影响更大,但不是一般人能提出来或实现的。以近几年模式识别和计算机视觉领域深度学习方法创新的一些成果为例,说 明有价值的选题有什么样的特点,什么样的选题适合研究生和青年学者去做。
刘成林

嘉宾简介:刘成林,中国科学院自动化研究所副所长,模式识别国家重点实验室主任,研究员、 博士生导师,中国科学院大学人工智能学院副院长。1989年毕业于武汉大学无线电信息工程系,1992年在北京工业大学获电路与系统专业工学硕士学位, 1995年在中国科学院自动化研究所获模式识别与智能控制专业工学博士学位。1996年3月到1997年10月在韩国科学技术院(KAIST)从事博士后研究。 1997年 11月到1999年3月在日本东京农工大学从事博士后研究。1999年3月到2004年12月在日立中央研究所(东京)先后任研究员和主任研究员。2005年起 在中国科学院自动化研究所任研究员。2008 年获得国家杰出青年科学基金资助。研究兴趣包括图像处理、模式识别、机器学习、文字识别与文档分析等。 在国内外期刊和学术会议上发表论文300余篇,合著英文专著一本。现任国际刊物Pattern Recognition 的副主编, Int.J.Document Analysis and Recognition, Cognitive Computation, IEEE/JAS Journal of Automatica Sinica, CAAI Trans. Intelligence Techno-logy 的编委,国内期 刊《自动化学报》的副主编。现任中国人工智能学会副理事长、会士,中国自动化学会理事、模式识别与机器智能专委会主任,中国图象图形学学会常务理 事,美国电气电子工程师协会会士 (IEEE Fellow)、国际模式识别学会会士(IAPR Fellow)。

Invited Report 2: 如何写优秀的科研论文
Summary:论文写作的基本原则是让读者容易阅读你的论文、能够从论文里得到你想传递的信息,同时读者认可传递的信息并且觉得有价值。 论文写作要找准立意、逻辑正确、简洁易懂、内容完整、引人入胜。论文写作是一个不停重写的过程,要从一开始有想法的时候就开始写作,而不是等有实验结果 的时候才动手写作。
王井东

嘉宾简介:王井东,百度首席架构师,分别于2001年和2004年在清华大学自动化系获得学士和硕士学 位,2007年在香港科技大学计算机科学与工程系获得博士学位。他的兴趣领域包括神经网络网络设计、人体姿态估计、大规模索引和行人重识别。他是/曾经是 IEEE TPAMI、IEEE TMM 和IEEE TCSVT 的副主编,并且是多个计算机视觉和人工智能会议的领域主席,例如CVPR、ICCV、ECCV、ACM MM、IJCAI 和AAAI。 他是 IAPR Fellow、ACM 杰出会员。他的代表作品包括深度高分辨率网络(HRNet)、交错组卷积、用于监督显着性检测的判别区域特征集成(DRFI)、用于 大规模相似性搜索的邻域图搜索(NGS、SPTAG)、用于紧凑编码的复合量化等。他为微软产品提供了多项技术,包括必应搜索、必应广告、认知服务和小冰聊天 机器人。在他的小组中开发的 NGS 算法是许多Microsoft产品的基本构建块。他率先开发了商业彩色素描图像搜索系统。 个人主页:https://jingdongwang2017.github.io

Invited Report 3: “青椒”科研中的“合”与“作”
Summary:科研合作是贯穿科研人员成长全过程的重要环节。在模式识别和计算机视觉领域,优秀的工作往往都是团队协作的成果。良好的合作 模式和合作关系可以极大地提升科研效率、促生新的思想、改善科研体验,从而对科研产生重要的促进作用。本分享将从与导师、与同辈、与学生以及与工业界等几种 常见的合作关系为例,探讨青年科研人员如何更加积极主动地在科研合作中做好自身的角色,最大化合作的价值。

嘉宾简介:黄高,清华大学自动化系助理教授,博士生导师。2015年获清华大学博士学位,2015年至 2018年在美国康奈尔大学计算机系从事博士后科研工作。主要研究领域为深度学习和计算机视觉,提出了主流卷积网络模型DenseNet。目前在NeurIPS,ICML, CVPR等国际顶级会议及IEEE多个汇刊共计发表学术论文50余篇,被引20000余次。获国家优秀青年基金资助、CVPR最佳论文奖、达摩院青橙奖、世界人工智能大 会SAIL先锋奖、中国自动化学会优秀博士学位论文、全国百篇最具影响国际学术论文、中国人工智能学会自然科学一等奖和吴文俊优秀青年奖等。



Invited Report 4: 科研项目申请中的几点建议
Summary:科研项目申请对于青年教师的发展至关重要。本报告简要分享在项目选题、项目团队组建、申请书撰写、项目答辩等关键环节中的一些建议,希望对青年教师有所帮助。

嘉宾简介:韩军伟,西北工业大学教授,获聘2018年度长江学者特聘教授,入选第四批国家“万人计划”科技创新领军人才,科睿唯安全球“ 高被引科学家”,爱思唯尔中国“高被引学者”。主要研究方向是人工智能、模式识别、类脑计算、遥感影像解译等。在领域顶级期刊/会议如:Proceedings of the IEEE,IEEE TPAMI,CVPR,ICCV, MICCAI等发表学术论文100余篇,论文被引用1.7万次,H-index 67。3篇论文入选年度中国百篇最具影响国际学术论文。获2021年度IEEE GRSS Highest Impact Paper Award(IEEE 地球科学与 遥感学会最有影响力论文奖)、国际期刊IEEE TCSVT 2021最佳论文奖、国际会议IEEE BIBM 2018最佳论文奖,国际会议ACM Multimedia 2010,MICCAI 2011和ICME 2016最佳学生论文奖提名。 培养多名博士生/博士后获得中国图象图形学学会(国家一级学会)优秀博士论文奖、陕西省优秀博士论文奖、博士后创新人才支持计划等。获陕西省科学技术一等奖(排名第一)等6项省部级科技奖。 担任IEEE Trans. on Neural Networks and Learning Systems、IEEE Trans. on Cybernetics、IEEE Trans. on Multimedia、《中国科学:信息科学》等多个国内外期刊编委,任国际会 议如:CVPR, ICPR, ACCV 等的领域主席。

Invited Report 5: 声誉提升

嘉宾简介:陈熙霖,ACM / CCF / IAPR / IEEE Fellow,中科院计算技术研究所研究员,其 主要研究领域为计算机视觉、模式识别、多媒体技术以及多模式人机接口。曾任IEEE Trans. on Image Processing 和 IEEE Trans. on Multimedia 的AE ,目前担任 Journal of Visual Communication and Image Representation的Senior AE、Research和Fundamental Research 编委,以及 计算机学报和模式识别与人工智能的副主编。担任(过)FG2013 / 2018、VCIP 2022、 ChinaMM 2018 / 2019 和 PRCV 2019 / 2020 大会主席,并多 次担任 CVPR 和 ICCV 等会议的领域主席。陈熙霖博士在国内外重要刊物和会议上发表论文 300 多篇,先后获得国家自然科学二等奖一项,国家科技 进步二等奖四项,以及北京市高等学校教学名师奖。

5. Organizer

嘉宾简介:林宙辰,北京大学教授,IAPR/IEEE Fellow,国家杰青,中国图象图形学学会机器视觉 专委会主任,中国自动化学会模式识别与机器智能专委会副主任。研究领域为机器学习、数值优化。发表论文 200 余篇,英文专著 2 本。多次担任机器 学习与人工智能顶级会议CVPR、ICCV、NIPS/NeurIPS、ICML、IJCAI、AAAI 和 ICLR 的领域主席,曾任 IEEE T. Pattern Analysis and Machine Intelligence 编委,现任 International J. Computer Vision、Optimization Methods and Software 编委。

嘉宾简介:王奕森,北京大学助理教授,博士生导师。研究方向为机器学习理论和算法,重点关注对抗鲁棒性、 图学习、弱/自监督学习理论等。目前已发表人工智能领域顶级学术论文 40 余篇,包括ICML、NeurIPS、ICLR 等,多篇被选为Oral 或Spotlight。曾获得 ECML 2021 最佳论文,ICML 2021 Adv Workshop 银牌最佳论文等。担任 NeurIPS 2021、ICLR 2022 领域主席(Area Chair),Neurocomputing 编委 (Associate Editor)。曾获百度奖学金( 2017 )和 ACM China 优秀博士论文提名奖( 2019 )。个人主页:https://yisenwang.github.io/


X光安检场景下的违禁品检测

1.Theme

X光安检场景下的违禁品检测

2. Purpose and Significance

近年来,随着利用携带违禁品实施恐怖袭击事件的逐渐增多,安检已成为反恐体系中的重要环节。现有的金属门、手持金属探测器、人工判图等安检方法存在查验 能力不足、检查速度慢、方式不够友好以及人力成本高等局限。随着以深度学习为代表的通用人工智能技术的快速发展,计算机视觉任务中的目标检测相关技术有 望为违禁物品的检测识别带来突破。近年来,国内外广泛认识到智慧安检系统的重要性,并将其上升到行业、甚至国家战略层面。例如,中国在社会治安防控领域 布局的“危爆物品扫描探测技术国家工程实验室”在清华大学揭牌。因此,如何进一步提升深度学习模型在存在目标遮挡、样本稀少、体积微小等特点的X光图像危险 品检测任务上的性能和鲁棒性,成为解决当前实现“智能安检”的核心问题。基于PRCV大会,本专题论坛关注于X光安检场景下的危险品识别任务,面向计算机视觉 相关子领域,如小目标检测、小样本学习、去遮挡、域适应等深受关注的复杂场景下的目标检测话题,以期促进学界和业界交流,推动社会进步。

3.Schedule

Time: October 30 16:00 – 18:00
Location:201会议室
Time Headline Speaker Host
16:00-16:30 基于小样本轻量学习的目标检测及安检应用 孙显 研究员 万方 博士
16:30-17:00 开放环境下的复杂目标检测方法 马宇晴 博士
17:00-17:30 X光安检图像智能识别系统研发及产业化应用 支洪平 总经理
17:30-18:00 面向真实场景的违禁物品检测 王伯英 博士

4. the Introduction of Invited Speakers

Invited Report 1: 基于小样本轻量学习的目标检测及安检应用
Summary: 结合典型应用场景,系统阐释基于小样本学习的目标检测方法,重点介绍元学习样本集构建、元知识表示、 元参数优化和元模型泛化性能提升等问题的解决技术,并介绍在安检等复杂实际场景中的目标检测应用。

嘉宾简介:孙显,中国科学院空天信息创新研究院研究员、博导。 长期从事我国地理空间信息智能处理与分析关键技术攻关。先后主持国家科技重大专项、国家重大型号工程等10余项任务。获 国家科技进步一等奖1项,中国科学院杰出成就奖1项,省部级奖励5项、入选中国指挥与控制学会“青年科学家”。发表SCI论文 收录70余篇,出版专著2部,授权发明专利24项。是IEEE高级会员,中科院青年促进会会员,任IEEE JSTAR、Remote Sensing 等国际期刊的编委/客座编委,遥感学报、中国图象图形学报等期刊的青年编委。

Invited Report 2: 开放环境下的复杂目标检测方法
Summary: 目标检测算法作为人工智能和计算机视觉的热门研究方向,广泛应用于机器人导航、智能视频监控、工业 检测、航空航天等诸多领域,具有重要的应用价值和现实意义。传统基于深度学习的目标检测算法极度依赖于大规模、高质量数据。然而, 在开放环境——如X光安检场景下,关键信息易受干扰,训练数据收集困难、硬件部署环境受限,使得目标检测模型面临着目标信号微弱、训 练样本稀疏、计算资源有限等问题。本报告围绕开放环境下复杂目标检测问题,介绍三个基于真实场景的高水平标注数据基准集,并分别从 信号抑制、语义进化、信息保持等视角出发,给出一系列精准、可靠、高效的目标检测方法,并围绕开放环境下复杂目标检测所面临的开放 性、复杂性、对抗性等挑战,探讨未来研究方向。

嘉宾简介:马宇晴,女,博士后。2021年博士毕业于北京航空航天大学,师 从人工智能专家李未院士和刘祥龙教授,现任职于北京航空航天大学计算机学院软件开发环境国家重点实验室,主要研究研究内容为开 放环境下非完备信息推理。近年来,发表包括IJCAI、ACMMM、ICCV、AAAI、IEEE TIP等在内的国际顶级会议及期刊论文16篇,其中CCF-A 类会议论文9篇(一作5篇),SCI Q1区论文3篇(一作1篇)。作为核心成员参与多个服务国家战略的重大项目,在安检影像危险品识别、边 防异常行为检测等场景中开展应用。获得百度奖学金四十强、北京市优秀毕业生、国家奖学金等诸多荣誉。个人主页:https://vickyfox.github.io/

Invited Report 3: X光安检图像智能识别系统研发及产业化应用
Summary: 报告阐述X光安检行业现状和发展趋势,提出智能化应用的核心问题、研究内容和技术难点,重点介绍如何充分 发挥数据红利和算法优势以及打造专门软硬件构建完整应用系统,以持续提升实战环境下禁限带品类别、检出率和准确率的具体实践过程和技术 成果。同时,针对安检行业信息化落后的现状,介绍了智慧安检全面解决方案和产品组合以及业务价值,并对如何通过前装赋能安检机厂商,加速 打造智慧安检生态体系进行介绍。本报告提供了AI赋能细分领域完整实践过程的典型案例。

嘉宾简介:支洪平,科大讯飞(苏州)科技有限公司总经理、科大讯飞苏州研究院 常务副院长,主持科大讯飞(苏州)科技有限公司和科大讯飞苏州研究院工作,具体负责人工智能在图像视频方向的应用研究、产品开发和产 业化。曾在联想和神州数码任职,创立并担任神州数码捷通科技董事总经理,苏州华亿安防科技董事总经理。从事过金融、电子政务、海关物 流、安防安检、人工智能等领域的多项信息化、智能化系统研发。曾获得神州数码最高荣誉“金帆奖”和科大讯飞最高荣誉“华夏创新奖”、首届 全球人工智能应用博览会金奖等。有丰富的科技企业研发和产品管理、经营管理和创业经验。任中国计算机学会技术前线委员会(CCF TF)委 员和苏州CCF CTO Club副主席,西交利物浦大学智能工程学院工业咨询委员会委员等。申请专利二十余项,软著十多项。毕业于中国科学技术 大学,目前清华大学创新领军工程博士在读。

Invited Report 4: 面向真实场景的违禁物品检测
Summary: 近年来,利用违禁品实施恐怖袭击的事件逐渐增多,世界各国加强了公共交通枢纽的安全检查。目前世界各国广泛采 用X光安检设备对被检查的包裹进行扫描并生成复杂的 X 光图像,随后由专业的安检员根据经验,找出可能存在的危险物品。然而这种方式存在明显 的问题,如查验能力不足、检查速度慢、以及人力成本高。这种传统的方式容易造成漏检情况,给公共安全造成极大的隐患。本报告将围绕智能安检 场景,介绍目前安全检查领域的X光安检数据集,并且探讨如何利用计算机视觉相关技术,在存在目标遮挡、样本稀少、体积微小等特点的 X 光图像 危险品检测任务上,开发出能够以较高的准确率和鲁棒性识别出违禁物品的智能安检系统。

嘉宾简介:王伯英,中国科学院软件研究所博士研究生,导师为武延军研究员,主要研 究内容为面向真实场景的目标检测。目标已发表CCF A类论文1篇,另有2篇论文在投。曾获国家奖学金 2 次、航天科技集团公司奖学金 1 次。作 为核心骨干参与中国科学院前沿科学重点研究计划、国家自然科学基金青年基金项目以及科技委重点项目。


5.Organizer

万方,中国科学院大学计算机学院在站博士后,合作导师为黄庆明教授。2019年在中国科 学院大学获得工学博士学位。2019年入选博士后创新人才支持计划,并获得2020年度中科院优秀博士论文称号。目前在国际顶级期刊IEEE TPAMI, IEEE TNNLS, IEEE TIP,国际顶级会议IEEE CVPR, IEEE ICCV, ECCV, NeurIPS ,AAAI等发表论文20余篇,并和华为诺亚方舟实验室等单位展开 深入合作,发表专利3项。主要研究方向为人工智能和计算机视觉,包括弱监督学习,主动学习和目标检测等。个人主页:https://wanfang13.github.io/FangWan.htm


陶仁帅,北京航空航天大学计算机学院博士研究生,研究内容主要包括:复杂视觉场景下的目 标检测、小样本学习和迁移学习。师从北京航空航天大学李未院士和刘祥龙教授。博士期间发表CVPR、ACM MM、TMM等顶级会议 、期刊论文4篇,在国际 顶级多媒体智能会议ACM MM 2020上受邀做关于X光违禁物品检测的口头报告。作为骨干参与工信部面向人工智能基础技术及应用的检验检测基础服务平 台建设项目、科技部科技创新2030—“新一代人工智能”等重大项目多项。个人主页:https://scholar.google.com/citations?user=IGDmVHsAAAAJ&hl=zh-CN


嘉宾简介:王伯英,中国科学院软件研究所博士研究生,导师为武延军研究员,主要研 究内容为面向真实场景的目标检测。目标已发表CCF A类论文1篇,另有2篇论文在投。曾获国家奖学金 2 次、航天科技集团公司奖学金 1 次。作 为核心骨干参与中国科学院前沿科学重点研究计划、国家自然科学基金青年基金项目以及科技委重点项目。



嘉宾简介:金博伟,科大讯飞(苏州)研究院计算机视觉团队负责人,主持核心算法团 队管理与建设。具体负责项目中的算法需求分析、技术路线和应用框架搭建。对科研团队建设、项目技术选型到追逐企业目标有着丰富的实际经验。 参与企业重点项目如:X光违禁品检测项目,并获得了X光首届天池比赛(津南数字制造算法锦标赛)第一名。曾在智慧教室项目中提出了一套轻量化 行为识别方法,并产出一篇AAAI2020 A类会议论文,以及申请专利2篇。


跨媒体分析和理解(第五届视觉大数据高峰论坛)

1. Schedule

Time: October 31 16:00-18:00
Location:第二会议厅(A)
Time Headline Speaker Host
16:00-16:30 可视身份安全识别与跟踪 胡瑞敏 郑伟诗,赫然,王亮
16:30-17:00 解离化表征学习 朱文武,王鑫
17:00-17:30 网络空间跨媒体内容安全 操晓春
17:30-18:00 多模态环境理解与行为预测 蒋树强

2. Proposed lecture content and introduction of invited speakers

Invited Report 1: 可视身份安全识别与跟踪

嘉宾简介:胡瑞敏,西安电子科技大学网络与信息安全学院院长,二级教授, 第七届中国青年科技奖和第五届中国青年科技创新奖获得者。曾任武汉大学学术委员会副主任委员、计算机学院/国家网络安全学院院长。 现任国家网络空间安全2030重大专项计划专家组成员,国家先进音视频标准专家组音频组执行主席。担任国家重点研发计划(在研)和重 大科技专项(已结题)首席专家,曾任海康威视公司第一任研究院院长、TCL公司技术顾问、美亚柏科研究所首席科学家,和华为、科大讯 飞等公司长期合作。先后主持四项多媒体大数据信息处理和网络空间自然行为与社会理解领域国家自然科学基金重点项目,指导研究生获 互联网+金奖、智慧城市大赛特等奖、移动终端大赛一等奖、CCF优秀博士论文奖、ACM中国优秀博士论文和中国图形图像学会优秀博士论 文提名奖。近年来开展包括多媒体信息处理、人工智能、大数据分析和自然行为与社会理解等技术在内的交叉学科研究,重点专注空间海 量视频编码与信息智能处理、大数据自然行为与社会理解(可信身份/隐秘组织/复杂关系/模式行为/安全解析)的理论与方法研究,16年 在美国NIST举办的国际视频大数据分析领域最著名的Trecvid实例竞赛中取得30项全球第一的优异成绩。

Invited Report 2: 解离化表征学习
Summary: 真实世界数据的形成通常源于许多潜在因子之间高度复杂的相互作用。现有深度学习方法忽略了这些潜在因 子在形成数据过程中展现出的高度耦合这一特性,导致学习到的表征不够鲁棒、缺乏可解释性。然而,在表征学习过程中解离化潜在因子之间 的耦合关系极具挑战,尚未得到广泛的研究。本报告将讨论我们在解离化表征学习方面的相关研究,将涵盖解离化图表征学习和多模态解离化 表征学习等主题。此外,我们还将讨论解离化思想在视觉推理等方向的实际应用。

嘉宾简介:朱文武,清华大学教授,博士生导师,现任信息科学与技术国家研究中心副主任, 清华大学人工智能研究院大数据智能中心主任, 大数据算法与分析国家工程实验室副 主任。曾任微软亚洲研究院主任研究员,英特尔中国研究院首席科学家与总监,及美 国贝尔实验室研究员 等职。国家973项目首席科学家,国家基金委重大项目、科技部人工智能重大专项项目 负责人。主要从事媒体大数据计算、网络多媒体、多媒体智 能等研究工作,发表高水 平国际论文350余篇,发明专利60余项。曾9次获ACM及IEEE等国际最佳论文奖。现担 任IEEE Transactions on Multimedia指导委员会主席,IEEE Transactions on Cir cuits and Systems for Video Technology常务主编。曾担任IEEE Transactions o n Multimedia 主编,IEEE Transactions on Mobile Computing和IEEE Transactio ns on Multimedia的 Steering Committee委员, ACM Multimedia 2018和ACM CIKM 2019大会主席。 IEEE Fellow、AAAS Fellow、 SPIE Fellow、欧洲科学院外籍院士。 获2012和2018年度 国家自然科学二等奖。

嘉宾简介:王鑫,清华大学计算机系助理研究员,浙江大学计算机科学与技术学士、博士,加拿大 西蒙弗雷泽大学计算科学博士。曾任清华大学博士后联合会理事长,现任中国计算机学会多媒体专业技术委员会副秘书长。获2017年度中国博士后创新人才支持计 划,2020年度 ACM中国新星奖。主要研究方向为媒体大数据计算,多媒体智能,机器学习等,在TPAMI, TKDE, TOIS, ICML, NeurIPS, KDD, WWW, ACM Multimedia, SIGIR等相关领域顶级期刊及会议上发表论文50余篇。



Invited Report 3: 网络空间跨媒体内容安全
Summary: 5/6G网络和AI技术的发展正持续改善网络空间的内容和服务质量,但同时也带来各种潜在内容安全问题:一方面,伪造、虚假、不良的媒体内容 充斥于网络空间,影响社会稳定和个人声誉;另一方面,公开来源网络数据蕴含丰富的各种商业情报,但由于其价值密度极低,导致高价值信息挖掘如大海捞针。针对上述网络空 间安全应用,报告人拟介绍报告人团队在网络空间视觉内容生成与识别方向学术探索的最新进展,以及搭建的一套视觉大数据价值挖掘系统。具体包括:开源数据的云弹性采集与 强智能搜索、数据驱动的自底向上深度抽象归纳、知识驱动的自顶向下演绎推理、人工智能深度攻防对抗等。

嘉宾简介:操晓春,国家杰出青年基金获得者,主要从事计算机视觉基 础研究和网络空间内容安全应用研究。担任IEEE汇刊 TIP、TMM、TCSVT的Senior Area Editor/Associate Editor, NeurIPS/ICCV/CVPR/IJCAI/AAAI/ICPR的Area Chairs。获2019年中共中央办公厅技术进步一等奖(排名第1)。CCF优博、中科院优博指导导师。




Invited Report 4: 多模态环境理解与行为预测
Summary: 真实环境复杂多变、行为动态多样、数据异质多源,如何利用多模态信息适应动态环境变化、如何从已知行为预测未知行为、 如何在动态环境中实现自主导航等问题都值得深入研究。报告对环境理解相关技术进行探讨,并分别介绍异常干扰感知的场景识别、结合直觉与因果等因素的 第一视角视频行为预测,基于层次化场景建模的视觉导航等技术。

嘉宾简介:蒋树强,中科院计算所研究员,博士生导师,国家杰出青年科学 基金获得者,中科院智能信息处理重点实验室副主任,国际期刊ACM ToMM编委,任CCF多媒体专委会秘书长、CCF专委工委委员,研究 方向为图像/视频等多媒体信息的分析、理解与检索技术,主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金等 项目20余项,共在IEEE/ACM汇刊和CCF-A类会议上发表论文60余篇,获授权专利15项,先后获中国计算机学会科学技术奖、中国图象图 形学会自然科学二等奖、吴文俊人工智能自然科学一等奖和北京市科技进步二等奖。

4.Summary

郑伟诗,博士,中山大学计算机学院教授、博导、副院长、机器智能 与先进计算教育部重点实验室副主任、大数据分析与应用技术国家工程实验室副主任。他致力研究(跨场景)行为感知信息,并结合 多种模态信息,实现高层语义理解与推理。他已发表180余篇主要学术论文,其中在人工智能顶级期刊IEEE T-PAMI及IJCV发表17篇、 国际顶级学术会议论文80余篇。担任Pattern Recognition、《自动化学报》等期刊的编委,担任国际顶级学术会议ICCV、CVPR、 IJCAI 等领域主席。作为负责人,主持承担国家重点研发课题、国家自然科学基金委联合重大项目课题、国家科技部重大攻关课题、 国防科技173计划基金、广东省重点基金、及其他5个国家级项目。获全国2020水下目标检测算法赛光学图像赛项一等奖、获CVPR等 国际顶级学术会议竞赛第一名3次;发布了“医用防护用具穿脱流程智能教官”等系统。获中国图象图形学学会自然科学奖一等奖、 广东省自然科学奖一等奖、广东省自然科学奖二等奖等;他是2020年中国高被引学者(爱思唯尔)、入选2020全球前2%顶尖科学家 榜单(斯坦福大学)。获国家优秀青年科学基金、英国皇家学会牛顿高级学者基金和广东省创新领军人才项目支持。

赫然,中科院自动化所研究员,中科院大学岗位教授,IAPR Fellow。 从事模式识别应用基础理论研究,并应用到计算机视觉、生物特征识别和人工智能安全,在华为、美团、京东等取得应用;近期 主要聚焦在非监督机器学习以及深度合成中遇到的瓶颈问题。出版信息理论学习专著1部, 在本领域国际主流期刊IEEE T-PAMI和 IJCV上发表论文20余篇,获IEEE SPS Young Author Best Paper Award(2020)、IAPR ICPR Best Scientific Paper Award(2020)、 IAPR/IEEE ICB Honorable Mention Paper Award(2019)和北京青年优秀科技论文一等奖(2015),承担了国家自然科学基金优青项目、 北京自然科学基金杰青项目和中科院青年促进会优秀会员项目等。他是IEEE T-IP、Patten Recognition和自动化学报等多个国内外期刊编委。


硬件友好的轻量化深度学习

1.Theme

硬件友好的轻量化深度学习

2. Purpose and Significance

以深度神经网络为代表的深度学习技术,在计算机视觉、语音识别、自然语言处理等方向上已经取得了巨大进展,并在卫生医疗、金融经济、国防军事等领域 广泛应用,发挥了极其关键的作用。然而,深度学习模型通常具有海量的参数以捕捉输入数据中的模式信息,并需要借助大量计算单元完成进行由浮点乘法和 加法构成的卷积操作,并且由于深卷积神经网络模型本身体积占用,离线部署时还必须在对应硬件设备上安装大量内存单元和高带宽收发设备。不仅如此,研 究表明,先进深度学习模型的计算量还在逐渐增长,其增长速度甚至快于硬件设备的算力增长。因此,先进的深度神经网络模型通常无法在算力有限的嵌入式硬 件中运行部署。近年来,国内外广泛意识到硬件友好深度学习技术对人工智能技术普及、发展落地的重要性,并将其上升到行业、甚至国家战略层面。因此,如 何使深度学习模型又快又好,使深度神经网络模型的部署落地到更多应用硬件场景,突破深度学习方法的端侧落地瓶颈,成为了解决当前人工智能模型与部署落 地关键问题的核心之一。本shou关注于硬件友好的轻量化深度学习,面向计算机视觉等相关任务的深度学习神经网络量化、模型剪枝和搜索、模型架构设计等深 受关注子领域,以期促进深度学习技术的小型化和高效推理,推动技术进步和社会进步。

3.Schedule

Time:October 31 16:00-18:00
Location:第二会议厅(B+C)
Time Headline Speaker Host
16:00-16:20 深度神经网络的压缩与加速研究 纪荣嵘 教授 秦浩桐 博士
16:20-16:40 稀疏神经网络加速器设计 程健 研究员
16:40-17:00 神经网络低比特量化 刘祥龙 教授
17:00-17:20 人工智能视觉芯片 刘力源 研究员
17:20-17:40 批标准化技术在轻量化模型中的应用 黄雷 副教授
17:40-18:00 视觉感知模型的多平台高效部署 余锋伟 副总监

4. Proposed lecture content and introduction of invited speakers

Invited Report 1: 深度神经网络的压缩与加速研究
Summary: 深度神经网络在图像理解、语音识别、自然语言处理等人工智能应用领域取得了令人瞩目的成就,成为 人工智能研究的热点之一。然而,随着网络性能的不断提高,网络的深度和广度也在不断增加,这就大大增加了网络的参数和计算复杂度。 如何压缩和加速这些大的神经网络模型成为学术界和工业界研究的热点。针对神经网络的加速和冗余度问题,本次报告简要介绍已有的加速 和压缩方法并在其中覆盖纪荣嵘教授研究组近几年来在神经网络压缩与加速中所做的一些工作与成果。

嘉宾简介:纪荣嵘,厦门大学南强特聘教授,国家杰出青年科学基 金获得者。主要研究方向为计算机视觉。近年来发表TPAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文 谷歌学术引用万余次。曾获2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖。曾/现主持国防973 项目,国家自然科学基金联合重点基金等项目。任中国计算机学会A类国际会议CVPR和ACM Multimedia领域主席、中国图象图形学学 会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。 个人主页:https://mac.xmu.edu.cn/rrji_en/

Invited Report 2: 稀疏神经网络加速器设计
Summary: 由于物联网计算资源受限,利用神经网络的稀疏特性设计神经网络加速器受到广泛关注。通过软硬件协同设计, 可在保证网络模型精度前提下有效提升加速器性能,从而实现模型精度与计算能效之间更好的平衡。本次报告将介绍当前稀疏神经网络加速器设 计的最新进展,并介绍我们在无规则稀疏架构设计和动态结构化稀疏加速方面的一些探索。

嘉宾简介:程健,中国科学院自动化研究所模式识别国家重点实验室 研究员、博士生导师。分别于1998年和2001年在武汉大学获理学学士和硕士学位,2004年在中国科学院自动化研究所获模式识别与智能 系统博士学位。研究兴趣包括深度学习、芯片架构设计、图像与视频分析等问题研究。近几年带领团队提出了系列基于量化学习的模型压 缩和加速算法,并研发了量化神经处理器(QNPU)芯片架构。相关成果曾先后获得中科院卢嘉锡青年人才奖、中国电子学会科技一等奖、 中国图象图形学学会科技二等奖等。个人主页:http://www.nlpr.ia.ac.cn/jcheng

Invited Report 3: 神经网络低比特量化
Summary: 大数据、大模型的学习范式极大提升了深度神经网络的性能,促进了计算机视觉、语音识别、自然语言处理等领域 的快速发展及广泛应用。然而,巨量的数据和参数引发了深度神经网络模型存储和计算等瓶颈问题,尤其在存储和算力等计算资源有限的端侧场景, 深度神经网络的部署应用面临严重制约。神经网络量化能够有效降低模型体积、提高计算效率,是网络压缩的有效手段之一。本报告将重点围绕神经网 络低比特量化,介绍线性量化与二值量化两种典型的低比特量化方式,并分别从量化场景下的优化策略、表征信息恢复的拓扑结构等视角,给出一系 列硬件友好的量化方法、典型场景应用及开源框架等工作,最后将展望低比特量化的发展方向。

嘉宾简介:刘祥龙,男,教授,博士生导师,国家优秀青年科学基金获得者。 现任职于北京航空航天大学计算机学院软件开发环境国家重点实验室,主要研究大规模视觉分析、可信赖深度学习。近年来,主持国家自然科学 基金、国防科技创新重点项目、科技创新2030重大项目等多项国家课题;发表IEEE CVPR、ICCV等国际顶级会议及期刊论文60余篇。担任Pattern Recognition、IET Image Processing等SCI期刊编委,ACM MM、AAAI等国际顶级会议领域主席,国家新一代人工智能产业创新联盟启智开源开放 平台技术委员会委员。曾获陕西省自然科学一等奖、北京市科技新星、微软铸星计划、中国计算机学会青年人才发展计划、中国计算机学会优秀博 士学位论文等。个人主页:http://sites.nlsde.buaa.edu.cn/~xlliu/

Invited Report 4: 人工智能视觉芯片
Summary: 随着摩尔定律的终结,芯片的处理性能越来越难以通过制程的改进而获得提升。而如今的边缘计算场景,如手机、安防监控、 自动驾驶等领域对数据吞吐率、处理速度、系统功耗都着极高的要求。人工智能视觉芯片通过将传感、存储、处理相结合,实现了对图像的高速、低功耗、智 能处理。传感器数据可直接在片上传输到处理单元,使得数据带宽极大提升。图像处理过程也借助轻量化模型压缩技术,进行完全片上处理,避免了与外存的 频繁交互,而实现低功耗。同时,它通过将图像特征提取过程中的处理层次进行划分,在运行过程中进行动态重构,对像素级处理、块级并行处理、非规则串 行处理都有更好的支持,避免了传统神经网络加速器对卷积运算过度优化而无法支持其他灵活图像处理操作的弊端。通过感存算的融合,人工智能视觉芯片在 边缘计算领域有着广泛的应用前景。

嘉宾简介:刘力源,男,博士,研究员,博士生导师。2005年获清华大学工学学士学位; 2010年获清华大学工学博士学位;2010-2012年在清华大学电子工程系从事博士后研究;2012年7月加入中国科学院半导体研究所半导体超晶格国家重点 实验室,任副研究员。取得的重要科研成果:完成了800×600分辨率、1000fps帧率高速图像传感器的整体设计和列并行读出电路设计,国内首次实现了具 有70dB动态范围的超高速图像传感器和超高速相机,传感器通过电子四所组织的第三方测试。开展CMOS太赫兹图像传感器的研究,突破了1THz频段的CMO S太赫兹像素的关键技术,为实现大规模展CMOS太赫兹图像传感器奠定了基础。在研和完成项目包括:重点基金项目《硅基太赫兹通信集成电路基础理论 与关键技术》,国家自然科学基金面上项目《硅基CMOS太赫兹波成像芯片研究》。 个人主页:http://lab.semi.ac.cn/yanjiusheng/contents/1323/124616.html

Invited Report 5: 批标准化技术在轻量化模型中的应用
Summary: 批标准化技术能够有效稳定训练、加速收敛并提高深度神经网络模型的泛化能力,其目前已经成为各种网络模型架构的基础成分。 基于剪枝、量化等轻量化模型构建技术通常可以看作是针对原始模型进行扰动,以求维持原始模型的预测能力。该报告将阐述批标准化技术如何在训练过程中学习 这种扰动“不变性”,如何有效利用批标准化技术的分布对齐特性来学习模型的紧致表示,以及如何调整批标准化技术的全局统计量来减少预测时的分布偏差。

嘉宾简介:黄雷,北京航空航天大学人工智能研究院副教授,于2010年和2018年 在北京航空航天大学计算机学院获得学士和博士学位,师从李未院士。曾受国家留学基金委资助,于2015至2016年在密歇根大学Jia Deng 课题组 进行访问研究。其2018年博士毕业后,在阿联酋起源人工智能研究院任Research Scientist,并于2021年加入北京航空航天大学人工智能研究院。 黄雷的研究主要集中在深度学习训练技术以及理论分析方面,并涵盖机器学习和计算机视觉多个领域。其近五年在人工智能领域顶级会议和重要期刊上 (如CVPR, ICCV, ICML, ECCV和NeurIPS等)发表论文二十余篇,并多次担任CVPR, ICCV, NeurIPS, ICML, JMLR和 IJCV 等顶级会议和期刊 的审稿人,曾以一作身份获CVPR 2020最佳论文提名奖。个人主页:https://huangleibuaa.github.io/

Invited Report 6: 视觉感知模型的多平台高效部署
Summary: 视觉感知模型在包括自动驾驶和智慧城市等众多场景具有巨大的产业价值,一个成熟的视觉感知算法往往需要面对包括云边 端在内的多个部署设备挑战,如何批量化的生产视觉感知模型并且在多个硬件平台进行高效部署,成为产业界涵待解决的难点。本次报告将会介绍我们是如 何处理并解决多平台硬件部署、量化/稀疏算法、硬件感知网络结构设计、软硬件协同设计等诸多模型落地痛点,最终用一套部署框架,支持月均部署超过 2千个视觉模型。

嘉宾简介:余锋伟,商汤研究院-研究副总监,SenseCore-模型工具链团队负责人, 本硕毕业于北京航空航天大学计算机学院。曾获得MOT16视频多目标跟踪冠军,ASC世界大学生超级计算机竞赛一等奖,华为奖学金,研究生国家奖学金等。 现负责公司内部Spring模型生产框架和Nest模型部署中台,致力于通过System+AI的视角推动深度学习算法的低成本、规模化落地,团队研究方向包括大 规模预训练模型算法与框架、视觉感知算法、模型多平台压缩与部署、软硬件协同等等。在ECCV、ICCV、CVPR、ICLR、ICPP、NeurIPS等AI和系统会议 上发表超过10篇论文。个人主页: http://forwil.xyz/

5.Organizer

嘉宾简介:秦浩桐(qinhaotong@buaa.edu.cn),北京航空航天大学计算机学院博士,研究内容 主要包括:硬件友好的深度学习,模型量化和二值化和模型端侧推理加速。博士师从北京航空航天大学李未院士和刘祥龙教授,博士 期间在包括ICLR、CVPR、ICCV等人工智能会议和期刊发表10篇论文,其中一作5篇,其中部分被接收为Oral文章,谷歌学术引用170 余次;所提出成果被媒体广泛报道,提出的算法被邀引入至包括香港中文大学OpenMM、百度PaddlePaddle、亚马逊DGL在内的众多 知名开源平台。部分成果在商汤、百度、美团、科大讯飞、字节跳动、腾讯等企业实际业务场景上线应用,同时成果支撑科技部“新一 代人工智能”重大项目、工信部人工智能算法检验检测平台、XX模型轻量化检测项目等国家科技、国防课题。作为组织者在AAAI 2022 大会举办PracticalDL-22 Workshop,同时担任IEEE Transactions on Image Processing、IEEE Transactions on Multimedia、 ACM Multimedia、Pattern Recognition等人工智能会议、期刊审稿人。曾获2021年度华为奖学金,2020年、2021年度国家奖学金和 2020年度腾讯犀牛鸟精英人才等。个人主页:https://htqin.github.io/

嘉宾简介:龚睿昊(gongruihao@sensetime.com),商汤科技高级研究员,北京航空航天大学计算机学院博士。 先后从事计算机视觉部署系统开发,模型量化压缩框架设计开发和相关算法研究,软硬件协同基础设施,服务大量业务线模型的高效落地。 曾获得商汤科技未来之星、腾讯犀牛鸟人才培养计划、CCF优秀大学生、北京市三好学生、国家奖学金等,在ICCV、CVPR、ICLR、ICML等 期刊会议上发表11篇论文(其中2篇一作,4篇二作),其中部分被接收为Oral文章,谷歌学术引用次数200余次。现主要研究和工作方向 为: 深度学习模型压缩、部署编译和软硬件协同,致力于打破硬件彩票假设,最大化榨取模型和系统的潜力。 个人主页: https://xhplus.github.io/

嘉宾简介:王培松(peisong.wang@nlpr.ia.ac.cn),中国科学院自动化研究所模式识别国家重点实验室副研究员。 于2013年在山东大学获学士学位,2018年在中国科学院自动化研究所获博士学位。目前主要从事深度学习、计算机视觉、神经网络高效计算等方面 的研究,在TNNLS、TOMM等国际期刊和ICML、CVPR、ECCV、 AAAI、 IJCAI等顶级国际会议上发表学术论文二十余篇,主持国家自然科学基金1项, 获得Nvidia奖学金、2019年NeurIPS MicroNet挑战赛ImageNet和CIFAR两项任务冠军。相关研究成果已经被华为、阿里巴巴等企业广泛应用。 个人主页: https://dblp.uni-trier.de/pers/hd/w/Wang:Peisong

嘉宾简介:沈志强(zhiqians@andrew.cmu.edu),卡耐基梅隆大学博后,即将担任香港科技大学研究助理教授。 研究兴趣包括机器学习、计算机视觉、高效深度学习等。目前在Eric Xing教授(穆罕默德·本·扎耶德人工智能大学&卡耐基梅隆大学)实验室担 任课题组研究负责人,2019-2021年在卡耐基梅隆大学Marios Savvides教授CyLab实验室担任博士后研究员。2017-2019作为UIUC/IFP组的联合 培养博士生,导师为Thomas S. Huang教授。同时将担任香港科技大学计算机科学与工程系 (CSE) 的研究助理教授(2022年初),以及香港科技 大学高等研究院的 IAS 初级研究员。个人主页: https://zhiqiangshen.com/


手绘草图理解算法及其前沿应用

1.Theme

手绘草图理解算法及其前沿应用

2. Purpose and Significance

计算机视觉领域中研究最多的是相机采集的图像、视频等,而对手绘草图的研究则相对较少。 然而随着手机、平板、AR/VR眼镜等职能交互设备的普及,手绘草图及其潜在的应用正受到研究者及普通用户越来越多的关注。 草图是人们对于所“见”的描绘,是一种跨跃语言、种族、时间的通用载体。对于手绘草图的研究,不是简单的对一种新模态图像的分析和处理,这其中更蕴含着对人类视觉系统的更深层次的理解。这是因为,相机等类似设备所采集的图像或视频都仅仅是对物理世界的真实/原样记录,而手绘草图是经过人为加工得到的,隐含着人类视觉系统是如何理解并表达视觉信息的。因此手绘草图是一种更“智能”的图像,对草图的研究能够帮助我们更好的理解人的视觉系统的工作机制,对设计更优的计算机视觉算法有极大的指导意义。 草图的相关研究在这两年迎来了长足的发展,是一个多领域交叉的研究方向,因此也受到了不同学界(计算机视觉、计算机图形学、机器学习等)的广泛关注。更重要的是,草图在很多方面具有较高的实用价值,例如基于草图的图像检索、基于草图的2D/3D图像合成、基于草图的原型设计、艺术创作等。这其中,草图的理解始终是各种研究和应用的核心问题。 因此,这次论坛旨在将领域内相关研究者聚集在一起,交流目前草图研究的最新进展和未来发展趋势,对其中的一些共性、难点问题进行交流和深入探讨。

3.Schedule

Time:October 31 16:00-18:00
Location:201会议室
Time Headline Speaker Host
16:00-16:10 欢迎 齐勇刚 于茜
16:10-16:35 Learning to understand Hieroglyphs and Sketches by Transformers 付彦伟
16:35-17:00 基于线稿交互的数字内容编辑与合成 高林 齐勇刚
17:00-17:25 基于深度学习的智能草图三维建模 韩晓光
17:25-17:50 StyleFormer: Real-time Arbitrary Style Transfer via Parametric Style Composition 盛律 于茜
17:50-18:00 总结 于茜 齐勇刚

4. Proposed lecture content and introduction of invited speakers

Invited Report 1: Learning to understand Hieroglyphs and Sketches by Transformers
Summary:The recognition of sequential data including hieroglyphs and sketches, are typically encoded as a list of discrete pen strokes in a vector format, rather than pixels. Essentially, due to the scarcity and long-tail nature of these sequential data, large-scale unlabeled instances may be available as source data, and only few labeled examples are used as the target data to help understanding these data. In this talk, I will introduce the series of our works in learning to understand the data of hieroglyphs and sketches by using the transformer-based models.

嘉宾简介:付彦伟,博士,复旦大学研究员,上海高校特聘教授(暨东方学者)、 国家青年千人计划学者。2014年获得伦敦大学玛丽皇后学院博士学位,2015.01-2016.07,在美国匹兹堡迪士尼研究院任博士后研究员。付博 士在重要国际期刊和会议上发表高水平论文80多篇。入职复旦后,申报人共发表论文80篇:第一作者/共同第一作者30多篇,通讯作者20多篇, 申请中国发明专利10多项,获得美国发明专利5项,Google Scholar引用次数超过4000多次。做为项目负责人,付博士先后主持2017年东方学 者、2018年青年千人、2019年上海市“科技创新行动计划”人工智能项目、2017年上海市青年“扬帆计划”、2018年国自科青年基金、2019年上海 市自然科学基金、多项华为合作项目、腾讯犀牛鸟基金、平安壹帐通等项目。申报人获2016年获澳大利亚国家研究理事会(ARC)颁发的杰出青 年基金项目获得者(DECRA Fellow),2017年获ACM China SigAI新星奖、上海高校特聘教授(暨东方学者),2018年获国家青年千人计划学者等 荣誉称号。付博士过去十年一直致力于,解决针对小样本、无监督样本、弱标记样本、多标签训练样本的大数据问题。2019年其论文获得多媒 体领域国际会议IEEE ICME最佳会议论文奖。

Invited Report 2: 基于线稿交互的数字内容编辑与合成
Summary:线稿提供一种用户用好的交互方式,可以方便用户进行数字内容的编辑和创作。常见的数字内容包括数字图像、动 漫和3D几何模型等。在本次报告中,我们将分享如何减少用户交互来对用户绘画的线稿图进行上色,以及如何使用线稿进行数字人脸图像的合成以及编辑。

嘉宾简介:高林,现任中科院计算所副研究员、博士生导师, 研究方向为智能计算机图 形学、深度几何学习等。他于清华大学毕业,获得工学博士学位,曾在德国亚琛工业大学进行公派访问研究。在ACM SIGGRAPH\TOG、IEEE TPAMI、IEEE TVCG、CVPR等知名期刊会议上发表论文40余篇。他获得亚洲图形学会青年学者奖、CCF技术发明一等奖等奖励,并获得英国皇家学会牛顿高级学者基金资助。


Invited Report 3: 基于深度学习的智能草图三维建模
Summary:基于简笔草图的三维形状建模一直以来都是计算机图形学非常重要的研究领域,这主要是由于草图往往是用户用来表达所想三维形状 最简便直接的方式。然而由于严重的信息不足和歧义性,从二维的草图中构建三维几何有着极大的挑战。随着深度学习的普及,利用神经网路强大的推理能力,目前 已经涌现了大量的基于数据驱动的草图三维建模工作。本报告将围绕着讲者近年在该方向的工作展开,主要将介绍如何基于草图进行快速三维人脸、人造物体以及动 物角色等方面的建模工作。

嘉宾简介:韩晓光,博士,现任香港中文大学(深圳)助理教授,2009年本科 于南京航空航天大学毕业,2011年获得浙江大学应用数学系硕士学位,2011年至2013年于香港城市大学创意媒体学院任研究助理,之后于 2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉、计算机图形学、虚拟现实和医疗图像处理等,在该方向著名国 际期刊和会议发表论文40余篇,包括顶级会议和期刊SIGGRAPH, CVPR, ICCV, ECCV, NeurIPS, IEEE TPAMI, ACM TOG 等。他的工作曾 获得CCF 图形开源数据集奖,计算机图形学顶级会议Siggraph Asia 2013新兴技术最佳演示奖,2019年和2020年连续两年计算机视觉顶级 会议CVPR最佳论文列表(入选率分别为0.8%和0.4%),他的团队于2018年11月获得IEEE ICDM 全球气象挑战赛冠军(参赛队伍1700多)。

Invited Report 4: StyleFormer: Real-time Arbitrary Style Transfer via Parametric Style Composition
Summary:In this work, we propose a new feed-forward arbitrary style transfer method, referred to as StyleFormer, which can simultaneously fulfill fine-grained style diversity and semantic content coherency. Specifically, our transformer-inspired feature-level stylization method consists of three modules: (a) the style bank generation module for sparse but compact parametric style pattern extraction, (b) the transformer-driven style composition module for content- guided global style composition, and (c) the parametric content modulation module for flexible but faithful stylization. The output stylized images are impressively coherent with the content structure, sensitive to the detailed style variations, but still holistically adhere to the style distributions from the style images. Qualitative and quantitative comparisons as well as comprehensive user studies demonstrate that our StyleFormer outperforms the existing SOTA methods in generating visually plausible stylization results with real-time efficiency.

嘉宾简介:盛律,博士,北京航空航天大学“卓越百人”特别副研究员,中国 图象图形学会三维视觉专委会委员,VALSE第五届/第六届执行委员会委员。2011年获浙江大学学士学位,2017年获香港中文大学博士学位。 同年加入香港中文大学多媒体实验室(MMLab)从事博士后课题研究。2019年入职北京航空航天大学软件学院。盛博士在PAMI/IJCV和 CVPR/ICCV/ECCV等重要国际期刊和会议发表论文30余篇,担任MLSP 2021 Special Session Chair,IJCAI 2021 SPC以及IEEE TPAMI 等重要期刊和CVPR等重要会议的审稿人。据Google Scholar统计,论文引用达1300余次。盛博士先后承担多项科技部2030项目和国家自然 科学基金等省部级项目。盛博士长期致力于三维视觉,特别是面向三维点云的生成、感知、理解和跨媒体推理。

5.Organizer

嘉宾简介:齐勇刚,博士,北京邮电大学人工智能学院助理教授,硕士生导师,英国萨里大 学CVSSP研究组访问学者。研究方向为计算机视觉与模式识别,重点研究草图理解、基于草图-图像的跨越检索及生成、视觉感知编组 等问题。主持或参与完成多项国家自然基金及北京市自然基金项目。近五年发表了包括国际顶级学术会议CVPR、ICCV、ECCV及期刊 TIP、TCSVT在内的20余篇学术论文。曾担任中国计算机学会视觉专委会主办的CCF-CV“视界无限”系列研讨会(第九期)执行主席, 担任ICCV 2021 研讨会 Sketching for Human Expressivity (SHE) 联合主席,担任了多个重要会议及期刊的审稿人, 包括CVPR 2022、ICCV 2021, BMVC 2020/2021, TIP, TNNLS, TMM等。

嘉宾简介:于茜,北京航空航天大学软件学院“卓越百人“副教授。2018年博士毕业于 英国伦敦玛丽女王大学电子工程与计算机学系SketchX Lab。后于美国加州大学伯克利分校进行博士后研究。2020年1月加入北航软件学院 视觉计算组。主要研究方向为计算机视觉和深度学习,包括基于深度学习的人类手绘认知和应用以及视频理解。她在计算机视觉领域的高 水平国际期刊和国际会议如:IJCV、CVPR、ICCV、ECCV等发表多篇论文。她和她的博士实验室同事在手绘识别上的工作曾荣获2015年英国 计算机视觉大会(BMVC)的最佳科学论文奖。


类脑视觉

1.Theme

类脑视觉

2. Purpose and Significance

类脑视觉是借鉴生物视觉系统的神经网络结构和信息加工机理而建立的一套新的视觉信息处理理论、技术、标准、芯片和应用系统。采用深度学习对静态图像和图像 序列(视频)分类识别的性能已经很高,但在视觉主动性和灵活性方面还远远不及生物。破解生物视觉的奥秘一直是机器视觉研究的梦想,但是,至今对生物视觉的 已知还远远小于未知,机器视觉研究至今还未跳出持续五十多年的“视频摄像头 + 计算机算法”基本范式。近年来生物成像技术的快速发展,“看清”生物视觉系统的 精细神经结构和信号加工过程正在成为现实,我们对生物视觉理解的科学前沿正在快速推进,类脑视觉面临实现重大突破的机遇,有望赋予智能系统像人类一样感知 环境、性能远超人类的真正视觉系统,从根本上重塑视觉信息处理的理论和技术体系。

3.Schedule

Time:October 17 15:20-17:20
Location:多功能北厅
Time Headline Speaker Host
13:30-13:45 脉冲视觉进展 黄铁军 教授 王威
13:45-14:00 Learning of Spiking Neural Networks 余肇飞 研究员
14:00-14:15 数据标注受限条件下的类人学习与场景感知 张兆翔 研究员
14:15-14:30 类脑计算、深度学习与医学影像分析 赵地 副研究员
14:30-14:45 受生物视觉机理启发的计算模型及机器视觉应用 李永杰 教授
14:45-15:00 基于“What”和“Where”的视觉神经信息编解码方法 何晖光 研究员
15:00-15:15 全光控忆阻器 诸葛飞 研究员
14:30-14:45 Scalable Edge Intelligence with Neuromorphic Computing Peng Wang Ph.D. Deputy Director

4. Proposed lecture content and introduction of invited speakers

Invited Report 1: 脉冲视觉进展
Summary:视觉是最主要的感知通道,光电视觉是最基本的感知手段,但是,当前的视觉感知系统采用视频(图像序列) 表达视觉信息,速度不可能超过视频帧率,而提高帧率又带来数据量和计算复杂度等比例增长的问题。脉冲视觉是颠覆图像和视频概念的新模 型,采用脉冲序列表达光的变化过程,能够有效保留物理光流的时序信息,物理意义更准确,形式更简洁,有望重塑视觉信息处理技术体系。 本报告将介绍最新进展:速度达到4万赫兹的脉冲视觉芯片,超高速目标和场景任意时刻图像重构系统,基于脉冲神经网络的超高速目标检测跟 踪系统等。

嘉宾简介:黄铁军,北京大学信息科学技术学院教授,北京智源人 工智能研究院院长,中国计算机学会会士,中国人工智能学会会士,国家杰青、长江学者和万人计划科技创新领军人才。主要研究方 向为智能视觉信息处理,对高效视频编码标准和视觉大数据分析处理技术体系做出了重要贡献,提出了脉冲视觉模型并开发了超高速 脉冲视觉芯片和系统。发表学术论文300多篇,作为主要起草人制定国家标准、国际标准和IEEE标准20多项,授权中国和国际发明专 利100多项。获国家技术发明二等奖(2017)和国家科学技术进步二等奖两次(2012,2010)。

Invited Report 2: Learning of Spiking Neural Networks
Summary:脉冲神经网络(Spiking Neural Network,SNN)被称为第三代人工神经网络,除神经元和突触状态之 外,脉冲神经网络还包含了时间状态。相比于前二代人工神经网络,脉冲神经网络具有高生物仿真、低功耗、高效等特征。本报告将介绍 脉冲神经网络的基本原理,分析当前研究现状与发展趋势,并结合课题组近年相关工作汇报脉冲神经网络学习研究中的最新进展及在脉冲 视觉中的应用。

嘉宾简介:余肇飞,北京大学人工智能研究院视觉感知中心研究员、 博士生导师。主要研究方向为类脑计算、神经网络。在Cell Patterns、IEEE Transaction汇刊和NeurIPS、CVPR、ICCV、IJCAI、 INFOCOM等顶级会议上发表论文30余篇,主持国家自然科学基金面上项目、博士后创新人才支持计划项目各一项,担任ACM MM、IJCAI、 IJCNN等会议PC Member,曾获北京市科学技术奖二等奖。



Invited Report 3: 数据标注受限条件下的类人学习与场景感知
Summary:基于深度学习的感知与理解模型通常依赖于大量的标注数据针对应用场景进行训练。然而对数据进行手工 标注需要耗费大量的时间和人力成本。这造成了模型广泛部署应用的一大阻碍,也同时成为了人脑智能和机器智能的一大区别。为此, 我 们研究如何能够在标注受限的条件下,少利用乃至不利用手工标注数据,来进行模型的有效训练和学习。从而一方面缓解手工标注带来的难 题;另一方面,赋予机器自动地从场景中挖掘获取信息的能力,使得机器在宏观的行为能力方面与人脑智能更加接近。本次报告将从受限标 注这一角度展开,结合域自适应、弱监督、半监督、自监督等范式,探讨如何针对场景的感知与理解这一任务进行信息的自动挖掘和模型的 学习训练。

嘉宾简介:张兆翔,博士,中国科学院自动化研究所研究员、博士生导师,中 国科学院大学教授,中国科学院脑科学与智能技术卓越创新中心骨干,入选“教育部长 江学者特聘教授”、“国家万人计划青年拔尖人才”, 研究方向包括:物体检测与分割,视觉认知计算,类脑 智能等,担任或曾担任 IEEE T-CSVT、Patten Recognition、NeuroComputing 编委(Associate Editor),是 CVPR、ICCV、AAAI、IJCAI、ACM MM、ICPR、 ACCV 等国际会议的领域主席(Area Chair)。



Invited Report 4: 类脑计算、深度学习与医学影像分析
Summary:医疗大数据主要包括电子病历(Electronic Health Record)数据,医学影像数据,基因信息数据,等。其中, 医学影像数据占现阶段医疗数据的绝大部分。如何将医疗大数据运用于临床实践?这是医学和计算机研究人员都很关心的问题,而智能影像与类脑 计算、深度学习提供了一个很好的答案。本报告结合医学影像大数据分析的最新研究进展和本课题组在医学影像大数据分析领域的工作,特别是在 阿尔茨海默病的核磁共振早期诊断为例,介绍了智能影像和类脑计算、深度学习在医疗大数据分析与疾病早期诊断领域的应用。

嘉宾简介:赵地,博士,获得美国路易斯安娜理工大学(Louisiana Tech University) 计算科学专业博士学位。赵地曾在美国哥伦比亚大学(Columbia University)和美国俄亥俄州立大学(The Ohio State University)从事博士后研究 工作。赵地博士正承担国家级和省部级科研项目多项。赵博士在“类脑计算、深度学习与医学影像分析”领域具有良好的研究经验,发表了三十多篇学术杂志 论文与学术会议论文。赵地博士担任《中国图象图形学报》、《中国数字医学》、《Annals of Multicore and GPU Programming》、《磁共振学报》、 《中国医疗设备》、《人工智能》等学术杂志编委。赵地博士发表著作1部,译著1部。赵地博士担任多项学术职务。

Invited Report 5: 受生物视觉机理启发的计算模型及机器视觉应用
Summary:视觉是人类认知外部世界最主要、最直接的形式。视觉感知也是大脑中最为复杂而又高效的信息加工过程之一。 而且,有很多生物具有超越人类的视觉感知和(或)认知能力,比如夜行动物的夜视能力、蛇类的红外感知能力、鹰类的小目标检测能力等。面对 复杂多变的非结构化环境,以智能环境感知为基础的众多机器视觉应用(如场景分析、目标检测、识别与跟踪等)有望从以自适应为核心的各种生 物视觉机理中寻求原理性启示和高效解决方案。本报告将在概述生物视网膜和视觉皮层结构和信号加工机理的基础上,介绍受其启发的计算模型及 机器视觉应用,如基于视网膜机理的图像增强技术,以及基于视觉中、高级信息加工机理的夜间红外图像白天彩色化技术、目标检测技术等。实验 结果表明,基于生物视觉感知和认知机理的环境感知和认知计算模型,在环境适应性和计算高效性等方面具有明显优势。

嘉宾简介:李永杰,电子科技大学生命科学与技术学院(神经信息教育部重点实验室) 教授、博士生导师、生物医学工程系主任、“视觉认知与类脑计算”研究中心负责人。2007年入选教育部新世纪优秀人才。2009-2010在哥伦比亚大学 神经科学系做访问学者。目前担任中国自动化学会理事及“生物控制论与生物医学工程”专委会主任委员、中国电子学会“生物医学电子学”分会副主任 委员、CCF计算机视觉专委会委员、CSIG类脑视觉专委会及机器视觉专委会委员等。是IEEE Senior Member。主要研究方向为生物视觉计算模型、 类脑智能及计算机视觉应用等。以第一作者或通讯作者在国内外重要期刊及会议上发表论文近百篇,包括工程类期刊 (含IEEE Transactions on PAMI/IP/ITS/CSVT/MM等IEEE汇刊论文20余篇,以及IJCV、PR等期刊)、神经科学类期刊(如NeuroImage), 以及ICCV/CVPR等计算机领域顶会论文。申请中国发明专利30余项(其中已授权25项)。获2020吴文俊人工智能自然科学三等奖(排名第一)等奖项。

Invited Report 6: 基于“What”和“Where”的视觉神经信息编解码方法
Summary:视觉信息编解码是通过计算方法建立从视觉系统与外界视觉刺激信息之间的映射模型,探索大脑视觉信息处理的过程和机理, 其研究不仅有助于探索视觉的加工机制,而且可促进计算机视觉的类脑研究。
过去的基于fMRI的神经编码模型要么依赖于对感受野空间特性的强先验假设,要么依赖于要⼈⼯设置的参数估计⽅法,这极⼤地限制了它们的编码能⼒。 为了解决这两个问题,我们提出了⼀个新的“what” 和“where” 神经编码框架,将深度神经⽹络分成特征维度(“what”) 与空间维度(“where”) 进⾏学习。 在空间维度,我们采⽤了稀疏和平滑的感受野进⾏编码。在特征维度,编码的神经⽹络特征图被同时回归到体素响应。我们将这两个维度的学习统⼀到端到端 的深度框架下,在公开的fMRI 数据集上的实验表明该⽅法⽐现有的⼏种⽅法具有更好的编码性能。另一方面我们还将介绍一个基于多视图贝叶斯深度生成模 型,可通过fMRI信号重建看到的图像。相关工作发表在IEEE TNNLS, IEEE TMM, IEEE TCDS, Info. Fus., Info. Sci., Pattern Recognition, AAAI上, 并被MIT Technology Review头条报道。

嘉宾简介:何晖光,中国科学院自动化研究所研究员,博士生导师, 中国科学院大学人 工智能学院岗位教授,福建省“闽江学者”讲座教授。中科院青年创新促进会优秀会员,中科院脑科学与智能技术卓越中心团队成员。CSIG视觉大数据专委会 以及机器学视觉专委会常务委员,CCF计算机视觉专委会委员,IEEE高级会员, CCF高级会员。分别于1994年(本科),1997年(硕士)毕业于大连海事大学, 1997-1999在大连海事大学任助教;2002年在中国科学院自动化研究获博士学位,同年留所工作。2003-2004在美国罗切斯特大学放射系做博士后研究, 2008年1-3月,在加拿大滑铁卢大学做高级研究学者,2014.10-2015.4在美国北卡大学教堂山分校做访问教授。何晖光博士先后主持7项国家自然科学基金 (包括1项重点,1项国际合作重点)、国家重点研发计划课题,863项目等多个重要项目。获得国家科技进步二等奖两项(分别排名第二、第三),北京市科 技进步奖两项,教育部科技进步一等奖(排名第三),获中科院首届优秀博士论文奖,北京市科技新星,中科院“卢嘉锡青年人才奖”等奖项,其研究领域为 脑科学、人工智能,医学影像处理,脑-机接口等, 其研究结果在IEEE TNNLS, IEEE TCYB, IEEE TNSRE, IEEE TCDS, NeuroImage, Human Brain Mapping, Pattern Recognition, MICCAI等相关领域的国内外核心期刊以及国际主流会议上发表文章150余篇。

Invited Report 7: 全光控忆阻器
Summary:目前人工智能是基于传统计算机,利用算法来实现。受限于计算机的冯·诺依曼瓶颈或存储墙,传统人工智能技 术越来越难以满足人类社会对海量信息的实时高效处理需求。在物理层面直接模拟人脑结构和功能的类脑计算属于新一代人工智能,有望在速度、能耗、 体积等方面全面超越现有技术。忆阻器可以很好模拟突触和神经元功能,并且结构简单,易于高密度集成,因此是实现类脑计算的较理想选择。忆阻器电 导可以通过电信号进行可逆调控,并且电导态可以保持。相比于电,光具有超快速度和优异的并行性,如果利用光调节忆阻器电导,则可兼具光子学和电 子学两者的优势,因此光电忆阻器吸引了越来越多研究人员的关注。但是,目前报道的光电忆阻器,光只能实现器件电导的单向调控,双向可逆调控必须 通过光和电信号结合,这极大限制了光电忆阻器的发展。
我们基于氧化物双层结构,突破了这个瓶颈,首次实现了全光控忆阻器。仅仅通过改变光的波长,就可实现忆阻器电导双向可逆调控,并且电导态 可以保持。全光控忆阻器能实现感/存/算一体,可用于构建新一代人工视觉系统。此外,全光控忆阻器工作机制不涉及微结构变化,并且所需光信号的功率 密度非常低,从而为克服忆阻器的稳定性难题和实现超低功耗提供了一条全新途径。我们的发现为忆阻器的研究和应用打开了一扇新窗口。

嘉宾简介:诸葛飞,研究员,博士生导师。本科和硕士毕业于西安交通大学,博士毕业于 浙江大学,其后得到日本学术振兴会(JSPS)的资助,在广岛大学以JSPS特别研究员的身份从事博士后研究,2008年至今在中科院宁波材料所工作,2018年 入选中科院脑科学与智能技术卓越创新中心骨干人才。主要从事半导体类脑智能材料与器件研究。在Advanced Materials、Advanced Functional Materials、Applied Physics Letters等期刊发表论文50余篇,被引用3000多次,H指数30。主持中科院战略性先导科技专项(B类)子课题、国家自然 科学基金(重点项目等6项)、浙江省杰出青年基金、浙江省自然科学基金重大项目等。

Invited Report 8: Scalable Edge Intelligence with Neuromorphic Computing
Summary:AI-enabled services become ever more pervasive and penetrating from consumer Internet to Industry internet. Edge intelligences make use of the widespread data generated at the connected devices, offered services without entirely relying on the cloud. It intends to balance the major factors of cost, latency, reliability, and privacy, and has become the key infrastructure in the digitalization era. Neuromorphic computing as a new paradigm and essentially AI 3.0 targets to solve the challenges in the edge applications such as robotics, autonomous vehicles, sensor-driven and time-series edge systems, and even wearable technology. We will present how Intel Loihi enabled the promising event-driven processing of spatial-temporal sparse data on the massive-parallel architecture. We will showcase the promising results of state-of-the-art SNN deployment and share some latest progress in Loihi chips.

嘉宾简介:Peng Wang,, Ph.D. Deputy Director of Intel Labs China. Dr. Wang is responsible for developing the research strategy for Intel Labs China and driving external collaboration programs with government, industry and academia. She manages the team of autonomous system research and drives the research prototypes into product reference design. Her domain expertise includes robot system, visual computing, human-machine interaction, as well as their applications in healthcare, education, manufacturing, retail, etc. She is Global Ambassador of Intel Master Branding program. She won Intel China Award, Intel Academy Award, and Employee of Year. She received Best Innovation Award, Best Wireless Application, Best Technology Award at CES. She has filed 15+ international patents and published 30+ research papers. She graduated from Tsinghua University, China majored in Computer Science and Technology.

5.Organizer

本次论坛由“类脑视觉专委会”组织举办。
联系人:王威,中国图象图形学学会类脑视觉专委会秘书长(wangwei@nlpr.ia.ac.cn)。



视觉显著性建模与计算

1.Theme

视觉显著性建模与计算

2. Purpose and Significance

图像和视频已经成为当今社会记录、表达和传递信息的主要媒介。因此,人们希望通过计算机高效、准确地处理这些日益增长的图像和视频。通 过模拟人眼的视觉注意机制来智能地检测显著性物体已经成为了计算机视觉领域中一个热门的课题,即显著性物体检测。显著物体检测对于理解 人类视觉系统的潜在机理非常重要且有助于现实中各种应用程序的发展,如视频分割,视频字幕,视频压缩,自动驾驶,人机互动等。然而由于 图像及视频数据自身的挑战(各种运动模式、遮挡、模糊、物体形变等)以及人类在动态场景中视觉注意行为(选择性注意分配,注意转移等) 固有的复杂性,使得视觉显著性建模与计算仍面临巨大的挑战。本次专题论坛将从视觉显著性建模与计算的前瞻性思想、新技术发展、关键问题 、行业机遇、未来挑战等方面开展沟通和讨论,旨在团结领域内外专家学者和相关科技工作者,共同促进显著性建模与计算领域的学术研究和思 想繁荣。

3.Schedule

Time:November 01 13:30-15:30
Location:201会议室
Time Headline Speaker Host
13:30-14:00 视觉显著性计算前沿研究方向简述 韩军伟 程明明
14:00-14:30 互补感知显著性检测前沿探索 刘青山 张鼎文
14:30-14:50 深度信息在显著性目标检测任务中的应用初探 丛润民 彭春蕾
14:50-15:10 面向非理想监督的视觉显著性检测 李冠彬
15:10-15:30 基于场景几何信息的显著目标检测研究 朴永日

4. Proposed lecture content and introduction of invited speakers

Invited Report 1: 视觉显著性计算前沿研究方向简述
Summary:视觉显著性计算旨在模仿人类的视觉注意力机制以识别视觉场景中最显著或最独特的区域或物体。它是基本的底层 图像处理技术之一,可以应用于许多下游计算机视觉任务中。从传统研究的角度来看,视觉显著性计算可以分为人眼关注点预测和显著物体检测。然 而,近年来的最新研究进展显示,该领域逐步产生出了许多新生的研究方向与研究分支,包括弱/半/无监督视觉显著性学习、协同显著性检测、多模 态显著性检测等。本报告将对这些新生研究方向和分支的目标与意义进行简要阐述,并介绍本团队在该领域的一些探索与思考。

嘉宾简介:韩军伟,西北工业大学教授,获聘2018年度长江学者特聘教授, 入选第四批国家“万人计划”科技创新领军人才,科睿唯安全球“高被引科学家”,爱思唯尔中国“高被引学者”。主要研究方向是人工智能、模式识别、类 脑计算、遥感影像解译等。在领域顶级期刊/会议如:Proceedings of the IEEE,IEEE TPAMI,CVPR,ICCV,MICCAI等发表学术论文100余篇,论 文被引用1.7万次。3篇论文入选年度中国百篇最具影响国际学术论文。获2021年度IEEE GRSS Highest Impact Paper Award(IEEE地球科学与遥感 学会最有影响力论文奖)、国际期刊IEEE TCSVT 2021最佳论文奖、国际会议IEEE BIBM 2018最佳论文奖,国际会议ACM Multimedia 2010,MICCAI 2011和ICME 2016最佳学生论文奖提名。培养多名博士生/博士后获得中国图象图形学学会(国家一级学会)优秀博士论文奖、陕西省优秀博士论文奖、 博士后创新人才支持计划等。获陕西省科学技术一等奖(排名第一)等6项省部级科技奖。担任IEEE Trans. on Neural Networks and Learning Systems、IEEE Trans. on Cybernetics、IEEE Trans. on Multimedia等多个国际期刊编委,任国际会议如:CVPR, ICPR, ACCV等的领域主席。

Invited Report 2: 互补感知显著性检测前沿探索
Summary:近年来,显著性检测技术得到了飞速的发展并取得了突破性进展,特别是基于深度学习的方法,在性能精度上都获得了很大提升, 然而,目前该领域的发展正面临来自真实开放场景应用的巨大挑战。本报告主要从互补感知的角度对显著性检测方法进行了一些探索,提出了基于互补感知注意力 的显著性检测方法,基于通道注意力分层U形网络的方法,以及探讨了显著性边缘信息和显著目标信息之间的互补性等工作。

嘉宾简介:刘青山,博士,现任南京信息工程大学教授、博导。2003年4月毕业于中科院 自动化所模式识别国家重点实验室获博士学位,随后留实验室工作,2006年4月赴美国Rutgers大学访问、工作。2011年9月加盟南京信息工程大学。先后 入选江苏省特聘教授、江苏省双创团队领军人才、江苏省优秀教育工作者、全国高校黄大年式教师团队、科技部中青年创新领军人才等。是江苏省人工智能 学会副理事长、中国自动化学会模式识别与机器智能专委会副主任、中国计算机学会计算机视觉专委会副主任等。主要研究方向为图像与视频分析、模式识 别、和AI+气象等。先后主持承担了国家杰出青年基金项目、国家自然基金重点项目、江苏省杰出青年基金等。以第一完成人获2016年度教育部自然科学二 等奖、2018年江苏省高等学校自然科学一等奖,以及第三完成人获2018年中国电子学会自然科学一等奖等。

Invited Report 3: 深度信息在显著性目标检测任务中的应用初探
Summary:受人类视觉注意力机制启发,视觉显著性检测任务旨在从给定的输入数据中提取最引人注意的区域或目标,已经被广泛应用于目标跟踪、 内容编辑、压缩编码、质量评价等研究领域,以及智能拍照、智慧医疗、自动驾驶、对地监测等工程领域。随着深度成像设备与硬件技术的发展,深度信息已经成功引 入显著性目标检测任务中,并取得了具有竞争力的性能。本次报告将从跨模态信息交互和深度质量感知两个关键问题入手,介绍两个RGB-D图像显著性目标检测的工作。

嘉宾简介:丛润民,北京交通大学信息科学研究所副教授,入选中国科协“青年人才托举工程”、 “北京市科技新星”计划、北京市科协“青年人才托举工程”、北京交通大学“青年英才培育计划”。IEEE/ACM会员、APSIPA IVM技术委员会委员、中国图像图形学会 青年工作委员会副秘书长、北京图象图形学学会理事。主要研究方向包括计算机视觉、人工智能、多媒体信息处理、视觉显著性计算等。主持、参与了包括国家自然 科学基金、国家重点研发计划、北京市科技新星计划在内的多项科研项目。在IEEE TIP、TCyb、TGRS、NeurIPS、CVPR、ECCV、ACM MM 等国际学术期刊及会 议上发表论文50余篇,其中CCF-A/IEEE Trans 论文29篇;授权国家发明专利15项。担任SCI期刊Signal, Image and Video Processing 编委。荣获IEEE ICME 最佳学生论文奖亚军、天津市科学技术进步一等奖、ACM SIGWEB 中国新星奖、中国图象图形学学会优秀博士学位论文奖、第十五届北京青年优秀科技论文奖等。

Invited Report 4: 面向非理想监督的视觉显著性检测
Summary:视觉注意力机制是人类视觉系统的重要特性之一,是指人在观察和感知周围世界的时候能够本能地快速定位并获取重要的信息。通过模拟视觉 系统的注意力机制,并从视觉数据中高效地提取显著区域或特征,可以有效提升各阶段计算机视觉任务的性能。在本次报告中,我将回顾项目组近年来在基于深度学习的视觉显 著物体检测方面的研究进展,并重点介绍针对非理想监督条件的视觉显著性检测的一些尝试,包括基于噪声标签环境、半监督设置、跨领域及无监督设置等条件下的显著区域检测 方法。

嘉宾简介:李冠彬,博士,中山大学计算机学院副教授,2016年在香港大学计算机科学系获博士学位, 主要研究方向为认知建模与视觉计算,尤其在视觉注意力机制模拟、跨领域的物体识别以及跨模态的视觉理解等方面取得一系列重要的研究成果,形成较为完整的研究体系。 迄今为止,已经累计发表论文100余篇,其中包含CCF A类/中科院一区论文60篇,包括T-PAMI,IJCV,TIP,CVPR,ICCV,ICML,AAAI等,Google Scholar引用超过3800次。 获得吴文俊人工智能优秀青年奖、中国图象图形学会科学技术一等奖、ACM中国新星提名奖、计算机视觉顶级会议ICCV2019最佳论文提名奖、2020年度英伟达AI城市 挑战赛冠军等荣誉。主持了包括广东省杰出青年基金、国家自然科学基金青年项目、国家自然科学基金面上项目、国家自然科学广东省联合基金、CCF-腾讯犀牛鸟科 研基金、美团北斗科研课题合作基金、商汤青年科研基金等10多项科研项目。担任The Visual Computer期刊编委,TPAMI、IJCV、TIP、TNNLS、TMM、TCYB、TOG 等权威期刊的审稿人,CVPR、ICCV、IJCAI、AAAI等国际会议程序委员会委员,VISAPP2019领域主席,NCIG2020竞赛主席。

Invited Report 5: 基于场景几何信息的显著目标检测研究
Summary:本报告围绕着低对比度、低光照、复杂纹理等实际开放环境中存在的显著目标检测精度低的问题,主要探讨基于场景深度信息和光场信息的显著 目标检测方法。所涉及的方法利用场景中颜色、光强、深度、多视角、聚焦等可表达场景几何结构的多路特征,实现了各路特征间的共享和互补,有效的解决了复杂 场景中显著目标检测的漏检/错检等技术难题,这将是本任务值得探索的另一研究方向。

嘉宾简介:朴永日,大连理工大学-信息与通信工程学院,副教授,博士生导师。研究方向为计算机视觉、 计算成像、人工智能等领域。目前共发表论文80余篇,包括CVPR/ ICCV/ ECCV/ NeurIPS /AAAI以及 IEEE TPAMI/ TIP等。曾获ECCV2020高质量优秀审稿人、省自然科学学术成果奖3项。担任VALSE 2018执行主席、IScIDE 2017专题主席。

5.Organizer

张鼎文,西北工业大学脑与人工智能实验室教授,2015赴美国卡耐基梅隆大学进行为期2年的 访问研究,曾入选中国博士后创新人才计划, 科睿唯安“全球高被引科学家”。所发表论文入选ESI高被引论文及热点论文十余次,1篇论文获2021 IEEE TCSVT 最佳论文奖,1篇论文入选2018年中国百篇最具影响国际学术论文,获中国图象图形学学会优秀博士论文奖,ACM China SIGAI(国际计算机学会中国人工智能分会) 优博奖,陕西省优秀博士学位论文奖等。是IEEE会员、ACM会员、中国图象图形学学会视觉大数据专委会委员、第六届VALSE执行领域主席委员会委员。主要从事 人工智能领域中的热点研究方向—计算机视觉、模式识别、多媒体信息处理、机器学习。致力于建立面向开放环境下、具备动态学习能力的新一代计算机视觉学习 框架。迄今为止,作为第一作者/通讯作者在领域内国际重要期刊及会议发表学术论文30余篇,其中包含T-PAMI, IJCV, IEEE SPM, T-IP, CVPR, ICCV, Science China: Information Science等,担任IEEE TMM与TCSVT的Leading Guest Editor, 担任ACM MM及ICCV的Workshop Organizer。

彭春蕾,西安电子科技大学副教授,硕士生导师,于2017年12月从西安电子科技大学获得信息与 通信工程(智能信息处理)专业博士学位(导师:高新波教授)。2016年至2017年前往美国杜克大学联合培养。研究领域包括计算机视觉、模式识别和信息 内容安全交叉研究,在IEEE TPAMI、中国科学:信息科学、IEEE TIFS、TIP、TNNLS、TCSVT、IJCAI、ECCV等国内外刊物发表论文20余篇。主持国家自然 科学基金青年项目、中国博士后基金特别资助、陕西省自然科学基础研究计划面上项目等,获陕西省优秀博士学位论文、中国图象图形学学会自然科学二等奖 (3/5)、中国图象图形学学会优秀博士学位论文奖等。担任VALSE执行领域主席委员会委员、中国人工智能学会CAAI人工智能与安全专委会委员、中国图象 图形学学会CSIG多媒体专委会委员等。

程明明,南开大学教授,计算机系主任,国家“万人计划”青拔、“优青”。他的主要研究方向是计 算机视觉和计算机图形学,在SCI一区/CCF A类国际期刊和会议上发表学术论文100余篇(含IEEE TPAMI论文16篇),论文Google学术引用2万余次,一作论文单 篇最高引用3800余次,连续4年入选Elsevier中国高被引学者榜单。技术成果被应用于华为手机智能拍照、推想科技CT影像智能分析、金风科技风电设备运行监控、 和中化农业病虫害识别等领域。获得ACM中国新星奖、天津市青年科技奖、吴文俊人工智能自然科学二等奖、中国图象图形学学会自然科学一等奖、教育部自然科学 一等奖等奖项。现担任中国图象图形学学会副秘书长、天津市人工智能学会副理事长和SCI一区期刊IEEE TIP编委。


模式识别的安全与隐私

1.Theme

模式识别的安全与隐私

2. Purpose and Significance

近年来,国内外广泛意识到智能系统安全和隐私的重要性,并将其上升到行业、甚至国家战略层面。因此,如何进一步提升基于深度学习的模式识别 应用的安全性与隐私性,突破深度学习的脆弱性机理,成为解决当前基于深度学习的模式识别模型与系统安全性并提升其可用性问题的核心。基于PRCV大会, 本专题论坛关注于模式识别的安全与隐私,面向计算机视觉等相关子领域的深度学习技术安全鲁棒性、模型可解释性、数据隐私保护、深度媒体生成、深度伪造 媒体取证等深受关注的话题,以期促进模式识别的安全和隐私保护规范发展,推动技术进步和社会进步。

3.Schedule

Time:November 01 16:40-18:40
Location:201会议室
Time Headline Speaker Host
16:40-17:00 深度学习模型的安全可解释性与鲁棒性 纪守领 李斌
17:00-17:20 可解释性博弈交互体系:对归因权重、鲁棒性、泛化性、视觉概念和美观性的统一 张拳石
17:20-17:40 人脸属性编辑及可解耦表示学习 左旺孟
17:40-18:00 Panel讨论 操晓春、刘祥龙、张卫明、沈琳琳
18:00-18:20 基于时空关联及域泛化的深度伪造人脸检测研究 纪荣嵘
18:20-18:40 生成能力驱动的深度伪造防御方法 张卫明

4. Proposed lecture content and introduction of invited speakers

Invited Report 1: 深度学习模型的安全可解释性与鲁棒性
Summary:随着计算技术的飞速发展,深度学习被广泛应用于众多智能系统。然而,应用繁荣的同时,深度学习系统 安全性也遭受对抗样例、后门攻击等层出不穷的威胁。本次报告将围绕深度学习模型的可解释性和鲁棒性,分析主流解释性方法的安全性, 并介绍CNN、RNN、LSTM等经典深度学习模型的鲁棒性量化方法。

嘉宾简介:纪守领,研究员,获美国佐治亚理工学院电子与计算 机工程博士学位、佐治亚州立大学计算机科学博士学位,现任浙江大学“百人计划”研究员、博士生导师、浙江大学滨江研究院国产 信创中心副主任,兼任佐治亚理工学院Research Faculty,入选多个国家和省部级人才工程。先后主持国家自然科学基金重点项 目和面上项目、国家重点研发计划项目(课题)、国家预研重点项目、创新特区项目、浙江省杰青项目、浙江省重点研发计划项目、 阿里巴巴科研基金、蚂蚁金服科研基金、华为科研基金、CCF-腾讯“犀牛鸟”科研基金、CCF-绿盟“鲲鹏”科研基金、CCF-启明星辰 “鸿雁”科研基金等多项,作为技术负责人或项目骨干,参加美国NSF项目8项。发表论文100余篇,包括IEEE S&P, ACM CCS, USENIX Security, KDD, CVPR等CCF A类论文70余篇,出版英文专编著4部,获最佳/优秀论文奖8项。申请专利30余项,研制了深度学习 模型安全与评估系统DeepSec、大数据驱动的反欺诈系统ATF、新型对抗性验证码生成系统aCAPTCHA (advCAPTCHA)、自适应知 识驱动的模糊测试系统MOPT、模糊测试评估平台UNIFUZZ、物联网固件漏洞挖掘系统iFIZZ等多个系统。其中,多个系统已被部署 应用于拥有千万用户级以上的商业大平台,相关成果被CCTV、人民网、新华网、凤凰网等二十余家媒体报道,产生了较大经济和 社会效益。MOPT在Google模糊测试公开评测平台上位列第一名(截至2021年1月);相关漏洞挖掘系统在实际系统和软件中发现 漏洞400余个,包括工业PLC漏洞数十个,IoT设备固件漏洞100余个,IoT协议漏洞(缺陷)100余个,已获得CVE 100余个,形成 了较大影响力。曾获美国著名高校弗吉尼亚理工学院(Virginia Tech)、凯斯西储大学(Case Western Reserve University)、 里海大学(Lehigh University)、佐治亚大学(University of Georgia)终身教职系列(Tenure-Track)助理教授职位, 获中国国家优秀自费留学生奖(中国海外留学生最高奖)、8项最佳/优秀论文奖、GSU杰出研究奖、ELSEVIER高引论文奖、《计算机 研究与发展》高引论文奖、浙江大学先进工作者、“个推”青年创新奖等。 个人主页:https://nesa.zju.edu.cn/webpage/crew/jsl.html

Invited Report 2: 可解释性博弈交互体系:对归因权重、鲁棒性、泛化性、视觉概念和美观性的统一
Summary:深度神经网络的可解释性近年来受到大家越来越多的关注,相关技术流派也呈百家争鸣的状态。但是目前 大部分可解释性算法往往侧重于工程性的功能实现,侧重于迎合人类对被解释事物的主观认知,而缺少基于统一的理论基础的科学理论体系, 影响了可解释性算法的严谨性,阻碍了可解释性研究的进一步发展。在本次演讲中,嘉宾将介绍其团队近年来在构建神经网络可解释性理论 方向的众多研究,即如何在博弈交互的理论框架下,统一解释神经网络的归因权重、神经网络的对抗鲁棒性、神经网络的泛化能力、神经网 络所建模的视觉概念分类,以及输入图像的视觉美观性。

嘉宾简介:张拳石,上海交通大学约翰霍普克罗夫特计算机 科学中心长聘教轨副教授,博士生导师,获得中组部青年千人计划资助,ACM China新星奖。他于2014年获得日本东京大学博 士学位,于2014-2018年在加州大学洛杉矶分校(UCLA)从事博士后研究,主要研究方向包括机器学习和计算机视觉。其研究 工作主要发表在计算机视觉、人工智能、机器学习等不同领域的顶级期刊和会议上(包括IEEE T-PAMI、ICML、ICLR、CVPR、 ICCV、AAAI、KDD、ICRA等)。近年来,张拳石在神经网络可解释性方向取得了多项具有国际影响力的创新性成果。张拳石承 担了ICPR 2020的领域主席,CCF-A类会议IJCAI 2020和IJCAI 2021的可解释性方向的Tutorial,并先后担任了AAAI 2019, CVPR 2019, ICML 2021大会可解释性方向的分论坛主席。 个人主页:http://qszhang.com/

Invited Report 3: 人脸属性编辑及可解耦表示学习
Summary:人脸属性编辑作为一种典型的条件图像生成问题,近年来受到了较多的关注。然而,早期的人脸属性 编辑方法如DIAT往往需要为每种属性编辑任务单独训练一个模型。因此,我们引入了一种AttGAN模型,结合自编码网络和生成对抗网 络,使得利用一个模型处理多种属性编辑任务成为可能。为了改善网络学习的稳定性和属性编辑效果,进一步提出了一种选择性迁移模 型STGAN。最近,我们从可解耦表示学习出发,提出了一种正交雅克比正则化方法,不仅能够应用于可解耦生成对抗网络的训练,还可 以用于已有的BigGAN模型的解耦变量发现和可控图像生成。

嘉宾简介:左旺孟,哈尔滨工业大学计算机学院教授、博 士生导师。主要从事图像增强与复原、图像编辑与生成、图像分类与视觉解析等方面的研究。在CVPR/ICCV/ECCV等顶级 会议和T-PAMI、IJCV及IEEE Trans.等期刊上发表论文100余篇。曾任ICCV2019、CVPR2020/2021等CCF-A类会议领域主 席,现任IEEE T-PAMI和T-IP等期刊编委。 个人主页:http://homepage.hit.edu.cn/wangmengzuo

Invited Report 4: 基于时空关联及域泛化的深度伪造人脸检测研究
Summary:随着生成网络技术的发展,深度人脸伪造技术(Deepfakes)及相关应用日趋成熟,利用该技术可以很容易地伪 造或替换人脸的面部区域。在娱乐泛化的同时,人脸伪造技术也给整个社会带来了巨大的隐患,例如用于制造虚假政治新闻或色情视频,这无疑 大大降低了社交媒体的可信度。为了防止AI技术的滥用,迫切需要一种高效的人脸伪造检测算法。针对深度伪造人脸检测问题,本次报告简要介 绍纪荣嵘教授研究组近期在伪造人脸检测中所做的一些工作与成果,包括DeeperForensics Challenge等竞赛的获奖方案。

嘉宾简介:纪荣嵘,厦门大学南强特聘教授,国家杰出青年科学基 金获得者。主要研究方向为计算机视觉。近年来发表TPAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文 谷歌学术引用万余次。曾获2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖。曾/现主持国防973 项目,国家自然科学基金联合重点基金等项目。任中国计算机学会A类国际会议CVPR和ACM Multimedia领域主席、中国图象图形学学 会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。个人主页:https://mac.xmu.edu.cn/rrji_en/

Invited Report 5: 生成能力驱动的深度伪造防御方法

嘉宾简介:张卫明,中国科学技术大学教授、博导,网络空间安全学院副院长, 图象图形学学会多媒体取证与安全专家委员会副秘书长。主要研究兴趣包括信息隐藏和人工智能安全。已在国际著名学术期刊和会议IEEE TIT、TPAMI、TIFS、TIP、 CVPR、ICCV、NeurIPS、AAAI等发表论文100多篇。主持国家自然科学基金重点、国家重点研发课题、国家863等项目20余项。获得军队科技进步一等奖、安徽省 自然科学奖一等奖和安徽省教学成果特等奖。带领团队2019年参加人工智能顶会IJCAI“人工智能算法对抗赛”,获得防御赛冠军和非定向攻击亚军;2020年参加 由Facebook、MIT等组织的全球最大的“深度伪造检测挑战赛(DFDC)”,获得亚军(30万美元奖金)。 个人主页:http://staff.ustc.edu.cn/~zhangwm/

5.Organizer

嘉宾简介:沈琳琳(llshen@szu.edu.cn),深圳大学教授,上海交通大学学士、硕士,受英国政府海外研究奖学金 资助在诺丁汉大学获得博士学位,博士期间获得“国家优秀自费留学生”奖励。2015-2021连续7年入选爱思唯尔计算机学科“中国高被引学者”, 2021入围斯坦福大学“科学影响力全球前2%科学家榜单”。现为深圳市“鹏城学者”特聘教授、英国诺丁汉大学计算机学院荣誉教授、澳门大 学杰出访问学者;广东省中英合作视觉信息处理实验室主任、深圳大学计算机视觉研究所所长、深圳大学医学影像智能分析与诊断研究中心主 任。研究领域主要包括深度学习理论及其在人脸识别/分析以及医学图像分析上的应用等,作为负责人连续主持国家自然科学基金重大研究计 划、面上项目等4项,发表学术论文300余篇。科研成果先后获吴文俊人工智能自然科学奖,中国电子学会、广东省、深圳市自然科学奖,国际 期刊《Image and Vision Computing》最多他引论文奖。开发的人脸识别算法曾获ICPR算法测试亚军,开发的细胞荧光图像分类算法连续获 得IEEE ICIP 2013、ICPR 2016国际细胞图像分类算法大赛冠军。 个人主页:http://csse.szu.edu.cn/cn/people31dd.html?25226

嘉宾简介:李斌(libin@szu.edu.cn),深圳大学教授,博士生导师。获中山大学通信工程专业学士学位, 通信与信息系统专业博士学位,美国新泽西理工学院联合培养博士。研究领域包括图像音视频信息内容安全,智能信息处理,机器学习等。 获国家自然科学基金、广东省自然科学基金杰出青年基金、深圳市基础研究重点项目等资助。发表包括国际权威刊物IEEE T-IFS、IEEE T-IP、IEEE T-CSVT等论文60多篇,编著教材1部。担任广东省智能信息处理重点实验室副主任,深圳市媒体信息内容安全重点实验室主任, IEEE IFS 技术委员会委员,广东省图形图象学会副理事长,中国图象图形学会数字媒体取证与安全专业委员会常务委员,《IEEE T-IFS》、 《信息安全学报》等期刊编委。获中国计算机学会科学技术奖自然科学一等奖。开发的Deepfake检测算法获DFGC2021检测赛道第一名。 个人主页:http://media-sec.szu.edu.cn/dr-bin-li/index.html

嘉宾简介:刘艾杉(liuaishan@buaa.edu.cn),北京航空航天大学助理教授,师从李未院士和刘祥龙教授,主要研究方向为鲁棒深度学习和可信赖人 工智能,具体包括对抗攻击、模型鲁棒性、模型可解释性等。针对当前人工智能安全性与可信赖性面临的模型评测不全、模型机理不清和模型防 御不强等关键挑战,申请人突破安全可靠深度学习技术,积极探索行业应用与落地,促进可靠深度学习在高安全风险场景下的健康发展。目前, 申请人已在包括IEEE TIP、ECCV、AAAI、CVPR在内的国际权威学术期刊和顶级会议等发表论文20余篇;申请专利10余篇。荣获省部级科技进步 二等奖一项(第三完成人)、腾讯犀牛鸟精英人才、启智社区优秀开源项目和开发者、CCF百名优秀大学生等奖励。担任模式识别经典期刊Pattern Recognition(SCI JCR Q1)专刊客座编辑,担任国际顶级会议(CCF-A类)AAAI和ACM Multimedia的workshop主席并组织4次“智能安全”相关 主题论坛。作为主要人员参与科技部人工智能重大专项和工信部基础平台建设等课题项目,参与标准编制2项、白皮书编制1项、专著编写1项。研 究成果被人民网、中国搜索等权威媒体专门报道,收录于《可信赖人工智能标准化研究(2021)》(白皮书)、《可解释人工智能导论》(专著) 以及《深度卷积神经网络模型质量》(团标草案)中,并被图灵奖获得者John Hopcroft作为领域经典工作进行引用和讨论。相关技术现已应用 于商汤科技Adela平台(支撑和指导工业级模型鲁棒性评测和构建)、人工智能安全评测开源平台“重明”(在工信部、科技部重点项目中应用) 以及OpenI启智开源社区中(助力开源社区算法安全评测)。 个人主页:http://sites.nlsde.buaa.edu.cn/~liuaishan/

嘉宾简介:吴保元(wubaoyuan@cuhk.edu.cn),深圳市大数据研究院大数据安全计算实验室主任,香港中文大学(深圳)数据科学学院副教授, 校长青年学者。2014年获得中国科学院自动化研究所模式识别国家重点实验室模式识别与智能系统博士学位。2016年11月至2018年12月 担任腾讯AI Lab高级研究员,2019年1月至2020年8月担任专家研究员。他在机器学习、计算机视觉、优化等方向上做出了多项出色工作, 在人工智能的顶级期刊和会议上发表论文40多篇,包括TPAMI, IJCV, CVPR, ICCV, ECCV, ICLR, AAAI等,并曾入选人工智能顶级 会议CVPR 2019最佳论文候选名单。他在人工智能安全的研究上有深厚的造诣,提出过多项原创算法,是国内较早从事该研究的资深专 家之一,并与腾讯安全团队开展了深入的合作。在腾讯工作期间,他领衔发布了业内第一个AI安全风险矩阵,得到业内和媒体的广泛关 注。2021年5月,其组织了“AI安全与隐私”系列学术论坛,将定期邀请知名专家学者分享AI安全与隐私领域的最新科研成果。其担任人 工智能权威期刊Neurocomputing编委、顶级国际会议AAAI 2021、IJCAI 2020/2021高级程序委员、ICIG 2021 领域主席、中国计算 机学会、中国自动化学会多个专业委员会委员。作为项目负责人承担国家自然科学基金面上项目1项,腾讯研究专项基金2项。 个人主页:https://sites.google.com/site/baoyuanwu2015/

嘉宾简介:张旭鸿(zhangxuhong@zju.edu.cn),获美国中佛罗里达 大学计算机工程博士学位,现任现任浙江大学控制学院副研究员,兼任 浙江大学滨江研究院百人计划研究员、服务安全与可靠性研究中心主任。先后作为课题负责人或项目骨干参与亿级国家项目1项, 国家重点研发计划项目(课题)1项,华为科研基金2项,美国NSF项目2项。致力于数据驱动的系统安全、人工智能与安全、大数 据系统与分析的研究,目前已发表国际高水平论文10余篇(如Usenix Security、VLDB、ICDE、TPDS、IEEE Transactions on Big Data、HPDC、IPDPS、JPDC等),其成果获得国际同行认可。在LinkedIn任职期间,作为团队核心成员,领导研发了 LinkedIn新一代端到端大规模自动化分布式机器学习平台,应用于公司多个部门(包括朋友推荐,工作推荐,人才搜索,广告 推荐等),提升公司内部机器学习生产效率近一倍;同时负责公司内部深度学习平台的设计与研发,促使公司多项产品由深度 学习模型驱动,取得了较好的社会和经济效益;提出的亿级ID表征学习算法,应用于LinkedIn工作推荐服务,在不损失精度 的情况下,比上一代模型体积减少近100倍,消耗的训练资源减少近100倍;相关成果申请3项美国专利,并开源一套人工智能数 据处理系统。 个人主页:https://person.zju.edu.cn/zhangxuhong

嘉宾简介:王奕森(yisen.wang@pku.edu.cn),北京大学助理教授,博士生导师。研究方向为机器学习理论和算法,重点关注对抗鲁棒性、 图学习、弱/自监督学习理论等。目前已发表人工智能领域顶级学术论文 40 余篇,包括ICML、NeurIPS、ICLR 等,多篇被选为Oral 或Spotlight。曾获得 ECML 2021 最佳论文,ICML 2021 Adv Workshop 银牌最佳论文等。担任 NeurIPS 2021、ICLR 2022 领域主席(Area Chair),Neurocomputing 编委 (Associate Editor)。曾获百度奖学金( 2017 )和 ACM China 优秀博士论文提名奖( 2019 )。 个人主页:https://yisenwang.github.io/

6.Round Table

嘉宾简介:操晓春(caoxiaochun@iie.ac.cn),中国科学院信息工程研究所研究员,主要从 事计算机视觉基础研究和网络空间内容安全应用研究;国家杰出青年、优秀青年基金获得者,入选国家“万人计划”青年拔尖人才支持计划;兼任IEEE TIP、 IEEE TMM、IEEE TCSVT的编委(SAE或AE)、NeuIPS/ICCV/CVPR/IJCAI/ACMMM等的Area/Track Chairs;指导博士生获得CCF优博论文和中科院优博论 文各1篇;获得省部级一等奖和二等奖各1项。个人主页: https://xiaochun-cas.github.io/zh-cn/



嘉宾简介:刘祥龙(xlliu@buaa.edu.cn),男,教授,博士生导师,现任职于软件开发环境国家重点实验室, 主要研究大数据检索、大规模视觉分析、可信赖深度学习。近年来,主持国家自然科学基金、国防科技创新重点项目、科技创新2030重大项目等多项国家课题;发表IEEE CVPR、ICCV等国际顶级会议及期刊论文60余篇。担任Pattern Recognition、IET Image Processing等SCI期刊编委,ACM MM 2019/2020领域主席,国家新一代人 工智能产业创新联盟启智开源开放平台技术委员会委员。曾获国家优秀青年科学基金、陕西省自然科学一等奖、北京市科技新星、微软铸星计划、中国计算机学会青年 人才发展计划、中国计算机学会优秀博士学位论文等。指导学生获得新一代人工智能产业技术创新战略联盟OpenI启智社区首届优秀开源项目、优秀开发者、PCM 2018 最佳学生论文等。 个人主页:http://sites.nlsde.buaa.edu.cn/~xlliu/

嘉宾简介:张卫明(zhangwm@ustc.edu.cn),中国科学技术大学教授、博导,网络空间安全学院副院长, 图象图形学学会多媒体取证与安全专家委员会副秘书长。主要研究兴趣包括信息隐藏和人工智能安全。已在国际著名学术期刊和会议IEEE TIT、TPAMI、TIFS、TIP、 CVPR、ICCV、NeurIPS、AAAI等发表论文100多篇。主持国家自然科学基金重点、国家重点研发课题、国家863等项目20余项。获得军队科技进步一等奖、安徽省 自然科学奖一等奖和安徽省教学成果特等奖。带领团队2019年参加人工智能顶会IJCAI“人工智能算法对抗赛”,获得防御赛冠军和非定向攻击亚军;2020年参加 由Facebook、MIT等组织的全球最大的“深度伪造检测挑战赛(DFDC)”,获得亚军(30万美元奖金)。 个人主页:http://staff.ustc.edu.cn/~zhangwm/

嘉宾简介:沈琳琳(llshen@szu.edu.cn),深圳大学教授,上海交通大学学士、硕士,受英国政府海外研究奖学金 资助在诺丁汉大学获得博士学位,博士期间获得“国家优秀自费留学生”奖励。2015-2021连续7年入选爱思唯尔计算机学科“中国高被引学者”, 2021入围斯坦福大学“科学影响力全球前2%科学家榜单”。现为深圳市“鹏城学者”特聘教授、英国诺丁汉大学计算机学院荣誉教授、澳门大 学杰出访问学者;广东省中英合作视觉信息处理实验室主任、深圳大学计算机视觉研究所所长、深圳大学医学影像智能分析与诊断研究中心主 任。研究领域主要包括深度学习理论及其在人脸识别/分析以及医学图像分析上的应用等,作为负责人连续主持国家自然科学基金重大研究计 划、面上项目等4项,发表学术论文300余篇。科研成果先后获吴文俊人工智能自然科学奖,中国电子学会、广东省、深圳市自然科学奖,国际 期刊《Image and Vision Computing》最多他引论文奖。开发的人脸识别算法曾获ICPR算法测试亚军,开发的细胞荧光图像分类算法连续获 得IEEE ICIP 2013、ICPR 2016国际细胞图像分类算法大赛冠军。 个人主页:http://csse.szu.edu.cn/cn/people31dd.html?25226


女科学家论坛

1.Theme

女科学家论坛

2.Schedule

Time:November 01 10:00-12:00
Location:第一会议厅
Time Headline Speaker Host
10:00-10:30 深度学习时代下步态识别技术的新探索 王蕴红 教授 张艳宁 教授
10:30-11:00 影像组学预测模型在腔内肿瘤筛查中的应用 卢虹冰 教授
11:00-11:30 结构指导的三维建模及分析 陈雪锦 副教授 董晶 副研究员
11:30-12:00 跨媒体知识图谱构建与学习 许倩倩 副研究员

3. Proposed lecture content and introduction of invited speakers

Invited Report 1: 深度学习时代下步态识别技术的新探索
Summary:步态识别通过分析行人体型与行走姿态来进行行人身份与属性的识别,具有能远距离识别、无需 对象配合、难以伪装模仿等特点,具有重要的研究和应用价值。近年来,随着深度学习技术的快速发展,步态识别技术的识别精度 大幅度提高。本报告在回顾步态识别技术的基本概念以及在深度学习时代所取得进展的基础上,介绍我们近期在步态识别领域的一 些新的探索,包括从行人属性、步态鲁棒性、行走动力学等不同角度研究步态识别问题的研究进展。

嘉宾简介:王蕴红,博士,教授,博士生导师,现任北京航空航天大学计算机学 院副院长,智能信息处理研究所所长, 智能识别与图像处理实验室主任。 王蕴红教授长期从事模式识别、图像处理、计算机视觉和机器学 习等领 域的研究,具体研究方向包括生物特征识别、智能视频分析、遥感图像 处理、信息隐藏和隐藏检测等,已在TPAMI、TIP和CVPR等国 际主流期刊 和会议上发表文章200余篇,作为负责人主持了“973”,“863”,国家自 然科学基金等多项国家级项目,于2005年获得国家技 术发明二等奖1项, 于2004年获得北京市科学技术奖一等奖励1项、三等奖1项,于2001年初 被科技部授予863计划先进个人。2003年入选 北京市科技新星,2005年 入选教育部新世纪优秀人才计划,作为程序委员会委员参与组织本领域 的多个权威国际学术会议,是TPAMI等国 际权威学术期刊和会议的审稿人。

Invited Report 2: 影像组学预测模型在腔内肿瘤筛查中的应用
Summary:腔内肿瘤临床表现隐匿,患者不易自查,导致很多腔内肿瘤诊断时已进展到中晚期。报告介绍了基于 患者CT/MRI影像的腔内肿瘤智能筛查和诊断技术,及其在临床高发的结直肠癌和膀胱癌筛查检测中的应用。

嘉宾简介:卢虹冰,第四军医大学生物医学工程系教授,博士研究生导师。 1988年和1991年在西安交通大学获得生物医学工程专业学士及硕士学位,1998年毕业于清华大学电机系获生物医学工程专业博士学位, 1999-2002年在纽约州立大学石溪分校IRIS实验室从事博士后研究。现任教育部计算机基础课程教学指导委员会委员、陕西省图形图象学 会常务理事、陕西生物医学工程学会理事等,《航天医学与医学工程》杂志编委,IEEETMI及IEEETNS等杂志论文评阅人,享受军队优秀 专业技术人才岗位津贴,2005年获军队院校“育才奖”银奖,2007年获“总后优秀教师”,2010年获陕西普通高校教学名师。主讲《计算 机基础与应用》《医学力图像处理》等课程,其中《计算机基础与应用》获2009年国家双语示范课程,获总后优秀教学成果奖,主编教 材2部,专著1部,译著1部。主要从事医学图像图形处理技术方面的研究,研究方向包括①低剂量CT/ECT成像、②基于影像的计算机辅助诊 断与治疗、③生理系统仿真与建模。先后承担国家级、军队级、省部级课题8项,获美国专利1项,国家发明专利1项,软件著作权2项。 2000年以来发表学术论文50余篇,其中SCI收录20篇。

Invited Report 3: 结构指导的三维建模及分析
Summary:人类无论是在理解还是构造三维场景时都基本遵循整体与部分的层次结构。近年来,越来越多的工作聚焦在 三维目标的层次化解析、结构化表达和结构化生成。同时,三维目标的结构先验能够大大提高深度神经网络在三维重建任务上的泛化能力。本报 告将详细介绍在深度学习框架中如何对几何结构信息进行有效表达,并利用结构信息来指导复杂场景的三维重建以及目标的三维结构化建模。

嘉宾简介:陈雪锦,现为中国科学技术大学信息学院副教授。2008年于中国 科学技术大学获得博士学位,2008-2010年于耶鲁大学计算机系从事博士后研究。2014微软亚洲研究院“铸星计划”访问学者、2017年美国斯 坦福大学访问学者。主要研究方向为计算机图形学、三维视觉、脑显微图像分析。在ACM SIGGRAPH、IEEE TVCG、TMI、ACM Multimedia 等期刊会议上发表学术论文60余篇,承担国家科研项目10余项,曾获CVM期刊2019年度最佳论文提名。详见 http://staff.ustc.edu.cn/~xjchen99/


Invited Report 4: 跨媒体知识图谱构建与学习
Summary:近年来大数据和人工智能技术飞速发展。以知识图谱为代表的大规模知识库技术在众多应用场景取得显著效果。 为将知识引入机器学习应用,我们首先针对社会媒体和风险检测应用构建了两类大规模跨媒体知识图谱。一方面,基于国内外主流社会媒体平台 数据进行爬取、清洗与对齐,构建包含文本、图片、视频、音频等多种模态的社会媒体知识图谱。另一方面,以维基百科、风险相关数据集为 基础,构建包含风险人物、事件及相关跨媒体信息的风险知识图谱。在此基础上,进一步讨论在知识图谱学习方法上取得的成果。首先,面向知 识图谱多任务学习中无关任务之间的负迁移问题,提出任务-特征协同迁移框架,从图视角出发,将任务、特征表示为图中的节点构造二分图,构 造参数矩阵的块对角约束显式指导模型迁移,并从理论上证明保障所提出算法具有全局收敛性及块对角结构恢复能力。其次,面向风险图谱中的 二分类长尾数据问题,提出ROC曲线下局部面积的高效优化算法,使性能指标聚焦于关键的性能区域。最后,面向风险图谱中的多分类长尾数据 问题,系统研究了其优化、泛化及一致性理论,并提出了高效的损失/梯度加速算法。

嘉宾简介:许倩倩,中科院计算所副研究员,国家优秀青年基金获得者。 硕士生导师,IEEE/CSIG/CCF高级会员,CSIG多媒体专委会副秘书长,CAAI深度学习专委会副秘书长。研究领域为数据挖掘和机器学习, 主要关注群智计算和知识图谱,已在TPAMI、IJCV、TIP、TKDE、ICML、NIPS、CVPR、AAAI、ACM Multimedia等国际期刊/会议上发表 CCF-A类论文40余篇(一作/通作PAMI 6篇)。先后获得:吴文俊人工智能自然科学奖一等奖,中国人工智能学会最佳青年科技成果奖, 中国图象图形学学会石青云女科学家奖,吴文俊人工智能优秀青年奖,ACM中国SIGMM新星奖, 中国人工智能学会优秀博士学位论文,中 科院百篇优秀博士学位论文,CCF-腾讯犀牛鸟科研基金、首届CAAI-华为MindSpore学术奖励基金等奖励。先后担任CCF-A类国际会议 ACM MM领域主席,AAAI和IJCAI SPC,并担任PAMI、CSVT、TMM、PR、ICML、NIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM Multimedia、 ICLR等多个刊物的审稿人。

5.Organizer

嘉宾简介:张艳宁,西北工业大学教授、博士生导师,国务院学科评议组成员、教育部“长江学者” 特聘教授、中组部首批“万人计划”科技创新领军人才、国防973项目技术首席、总装侦查测绘专家组成员。 现任西北工业大学校长助理、国家发改委“空天地海一体化大数据应用技术国家工程实验室”负责人、“移动平台环境感知及空天应用”国家级国际联合研究 中心负责人、“无人航行智能感知与自主计算”国家级“111”引智基地负责人、陕西省语音与图像处理省重点实验室主任、陕西省首批重点科技创新团 队负责人。兼任中国体视学学会副理事长及图像分析分会主任、中国图象图形学学会常务理事、女科技工作委员会主任及成像探测与感知专委会主任、 中国计算机学会理事、中国人工智能学会理事、陕西省信号处理学会理事长等。 张艳宁教授一直致力于信号与信息处理、人工智能、大数据分析与挖掘、媒体信息安全、计算机视觉与模式识别等研究。近五年来,在国内 外重要学术期刊和会议上发表论文百余篇,包括TPAMI、TIP、PR、IEEE TSMC-B、Info.、CVPR、ICCV、ECCV、ACM Multimedia等,获授权发明专利 40余项,出版专著3部。曾多次担任国际重要学术会议大会主席、程序委会主席、组织委员会主席及宣传主席等;担任IEEE TGRS、TMM、PR副编辑、 Neurocomputing客座编辑、《电子学报》常务编辑等。先后获得国家教学成果二等奖1项、包括国防技术发明一等奖、陕西省科技进步一等奖等省部级 科技奖励6项;先后获全国“三八”红旗手、总装863科技攻关先进个人、宝钢优秀教师等荣誉称号。

嘉宾简介:董晶,2010年博士毕业于中科院自动化研究所模 式识别国家重点实验室,现任中国科学院自动化研究所智能感知与计算研究中心副研究员。主要从事图像处理、计算机视觉、多媒体内容安全方面的研 究工作,已在国际权威期刊及学术会议上发表学术论文50余篇,申请发明专利20余项,其中已授权10项中国专利及3项美国专利。主持或主要参与了国 家863计划、973计划,科技支撑计划、重点研发计划、国家自然科学基金等20余项国家和省部级科研项目。现为中国科学院青年创新促进会会员;中 国人工智能(CAAI)学会理事、杰出会员;中国图象图形学学会(CSIG)理事、副秘书长;CSIG女科技工作者委员会秘书长,CSIG数字媒体取证与安全 专委会常委、副秘书长、CSIG视觉大数据专委会委员、中国计算机学会(CCF)计算机视觉专业委员会委员,北京图象图形学学会常务理事,青工委主任; 亚太信号与信息处理协会(APSIPA)多媒体安全取证专委会委员、美国电气电子工程师学会(IEEE) 高级会员、IEEE亚太区执委、IEEE亚太区人道主义科 技活动委员会主席(2019-2022)、IEEE亚太区女工程师委员会主席(2017-2018)、IAPR 《Newsletter》主编, Elsevier 《Journal of Information Security and Application》国际期刊的副主编,曾获2016年度IBM教职人员奖、2018年度国际模式识别大会最佳 科技论文奖、2019年度中国人工智能学会杰出贡献会员奖、2020年度CSIG石青云女科学家奖(青年组)。多次担任IEEE TIFS, TIP, IJCAI,ICCV, ECCV, CVPR,ICIP,ICPR等本领域权威的国内外相关学术会议的论文评审与会议组织工作。


极市技术论坛

1.Theme

极市技术论坛

2.Schedule

Time:November 01 13:30-15:30
Location:第二会议厅(B+C)
Time Headline Speaker Host
13:30-14:00 大规模图像的多粒度目标检测 程明明 刘若水
14:00-14:15 极市开发者平台介绍 廖昌粟
14:15-14:45 智能交通中的多模态视觉感知关键技术研究 金一
14:45-15:00 立足人工智能产业生态,赋能人工智能人才培养 王乐驰
15:00-15:30 可信学习与目标检测 张宝昌

3.Proposed lecture content and introduction of invited speakers

Invited Report 1: 大规模图像的多粒度目标检测

嘉宾简介:程明明,南开大学教授,计算机系主任,国家“万人计划”青拔、“优青”。 他的主要研究方向是计算机视觉和计算机图形学,在SCI一区/CCF A类国际期刊和会议上发表学术论文100余篇(含IEEE TPAMI论文20篇),论文 Google学术引用2万余次,一作论文单篇最高引用4000余次,连续5年入选Elsevier中国高被引学者榜单。技术成果被应用于华为手机智能拍照、推想 科技CT影像智能分析、金风科技风电设备运行监控、和中化农业病虫害识别等领域。获得ACM中国新星奖、天津市青年科技奖、吴文俊人工智能自 然科学二等奖、中国图象图形学学会自然科学一等奖、教育部自然科学一等奖等奖项。现担任中国图象图形学学会副秘书长、天津市人工智能学会副 理事长和SCI一区期刊IEEE TPAMI, IEEE TIP编委。

Invited Report 2:极市开发者平台介绍

嘉宾简介:廖昌粟,极视角科技AI产品经理







Invited Report 3:智能交通中的多模态视觉感知关键技术研究

嘉宾简介:金一,北京交通大学计算机与信息技术学院教授,博导,院长助理。 任中国图象图形学学会交通视频专委会副秘书长,中国计算机学会YOCSEF总部委员,多媒体专委会委员等。主要研究方向为交通视频语义理解、 可信行为分析、人脸防伪及面部识别。在CVPR,AAAI,ICCV,IJCAI,ACM MM等重要会议或期刊上发表论文70余篇。主持包括国家自然科学基 金、国家重点研发计划、北京市自然科学基金、JKW领域基金、教育部-中移动联合重点项目等项目。任2019 IEEE BESC出版主席,CCF A类 会议AAAI SPC,ACM MM、IEEE ICSP PC等。研究成果在智慧城市、智能交通、能源电力等领域实现产业化应用。获中国计算机学会科学技术 奖科技进步优秀奖1项(2020),北京市高等教育教学成果奖二等奖1项(2017),入选京东研究院“葡萄树学者计划”(2020)。

Invited Report 4:立足人工智能产业生态,赋能人工智能人才培养

嘉宾简介:王乐驰,极视角科技高校合作经理







Invited Report 5:可信学习与目标检测

嘉宾简介:张宝昌,教授,主要从事计算机视觉、机器学习领域研究,聚焦 于面向边缘计算的视觉感知研究。近五年发表录用IEEE汇刊、CCF A期刊和会议论文70余篇,2篇入选热点论文和5篇入选高引论文,单篇论 文谷歌引用1079次。入选教育部新世纪优秀人才项目,深圳市孔雀计划团队项目,获得一级学会/省级自然科学奖3项和国际重要比赛第一名 3项。爱思唯尔(Elsevier) 2020年中国高被引学者。



5.Organizer

嘉宾简介:刘若水,极视角科技联合创始人




>