学术报告

信电号角系列学术报告: 大规模语言模型参数微调及领域应用

发布日期:2023-09-11 浏览次数:

报告人: 袁彩霞  副教授,北京邮电大学

报告时间:2023年09月12日(周二) 9:00-11:00

报告地点:信电楼641报告厅

联系人: 文娟  13810019054  邮箱:wenjuan@cau.edu.cn

 

报告简介:

大规模语言模型已被证明具有强大的语言生成、上下文推理、样本泛化等能力。然而,由于缺少密集型专业知识及参数规模过大导致的调优困难,大模型在专业领域及专门任务上的表现仍然不能满足实际要求。如何高效利用大模型的各项能力、如何优化大模型使其适配更多的领域应用、如何在弱数据资源下实现大模型的高效推理,是大模型研究面临的主要难题。本报告将深入讨论上述问题,并分享若干有意义的探索。


报告人简介:

袁彩霞,北京邮电大学人工智能学院副教授,博士生导师。研究兴趣为自然语言处理和交互式人工智能。主持或参与的在研项目包括自然科学基金课题一项、国家重点研发计划子课题两项,主题涵盖自然语言生成、智能客服、知识图谱、多模态认知大模型等。近三年年在ACL、EMNLP、AAAI等重要学术会议发表论文10余篇;多次参与ACL举行的汉语信息处理评测,并获得多个第一名。


电话:010-62736746

邮箱:eic@cau.edu.cn

地址:北京市海淀区清华东路17号

邮编:100083

微信关注

©2017 信息与电气工程学院 校备案号:308_19034