报 告 人:张林峰,上海交通大学人工智能学院
报告时间:2024年11月23日(周六)14:00-16:30
报告地点:中国农业大学东区 信息与电气工程学院 237会议室
联 系 人:马老师 13391809180
联系邮箱:sockline@163.com
报告人简介:
张林峰,上海交通大学人工智能学院助理教授,博士生导师。2024年6月在清华大学交叉信息研究院获博士学位。他的研究方向为高效的人工智能(Efficient AI),包括大模型、图像视频生成模型、人工智能数据集的压缩与加速等。他在CCF-A等高水平学术会议与期刊上发表第一作者和通讯作者论文二十余篇,被引用2000余次,担任NeurIPS,ICLR,ICML,CVPR,ICCV等多个学术会议的审稿人,曾获北京市优秀毕业生,清华大学优秀博士论文,微软学者奖学金(亚洲共十二名)等。
报告摘要:
近年来,基于扩散模型的图像、视频生成技术迅速发展,掀起了AIGC(基于人工智能的内容创作)的浪潮,推动了内容创作领域的革命。然而,与传统的生成式模型相比,扩散模型所具有的独特的多步生成机制导致其计算成本极高,在实际应用中响应速度过慢,限制了扩散模型的商业化应用。另一方面,传统模型压缩技术中的剪枝、蒸馏方法虽然有效,但训练成本极高,在实际应用中存在局限性。本次报告主要介绍张林峰助理教授在扩散模型在推理阶段的加速方法,主要包括词元裁剪技术与特征缓存技术。这些方法在不需要训练和数据的前提下成功地将扩散模型的推理速度加速10倍以上,同时并不损失模型的生成效果。此外,该报告也将介绍在当前视觉生成加速领域仍然存在的诸多挑战。