中国农业大学信息与电气工程学院

学术报告

信电号角系列学术报告: 大规模语言模型参数微调及领域应用

发布日期：2023-09-11 浏览次数：

报告人: 袁彩霞副教授，北京邮电大学

报告时间：2023年09月12日（周二） 9:00-11:00

报告地点：信电楼641报告厅

联系人: 文娟 13810019054 邮箱：wenjuan@cau.edu.cn

报告简介：

大规模语言模型已被证明具有强大的语言生成、上下文推理、样本泛化等能力。然而，由于缺少密集型专业知识及参数规模过大导致的调优困难，大模型在专业领域及专门任务上的表现仍然不能满足实际要求。如何高效利用大模型的各项能力、如何优化大模型使其适配更多的领域应用、如何在弱数据资源下实现大模型的高效推理，是大模型研究面临的主要难题。本报告将深入讨论上述问题，并分享若干有意义的探索。

报告人简介：

袁彩霞，北京邮电大学人工智能学院副教授，博士生导师。研究兴趣为自然语言处理和交互式人工智能。主持或参与的在研项目包括自然科学基金课题一项、国家重点研发计划子课题两项，主题涵盖自然语言生成、智能客服、知识图谱、多模态认知大模型等。近三年年在ACL、EMNLP、AAAI等重要学术会议发表论文10余篇；多次参与ACL举行的汉语信息处理评测，并获得多个第一名。

学术报告

信电号角系列学术报告: 大规模语言模型参数微调及领域应用

最新信息