信息工程学院开展“大语言模型原理、演进及应用”学术讲座

作者：刘楚涵摄影：刘楚涵编辑：路璐审核：冯浩时间：2023-10-19 浏览：

10月18日下午，为了开拓学生视野、了解前沿技术发展状况和发展趋势，更好的培养专业型人才，信息工程学院邀请了湖北大学计算机与信息工程学院教授、硕士生导师马传香教授在学院楼4203室为信息工程学院师生开展了题为“大语言模型原理、演进及应用”的学术讲座。本次讲座由我院彭庆喜教授主持，信息工程学院部分老师出席，并在课上引起了很多同学的讨论和提问。

讲座开始前，彭庆喜对马传香教授的学术研究背景做了简要介绍，马传香博士毕业于华中科技大学计算机软件与理论专业，是武汉爱迪科技有限责任公司科技副总。马传香从事数据挖掘、人工智能相关方向的研究和应用工作已有多年，经验丰富；同时参与的基金项目、发明的专利、发表的论文不仅从数量上更从质量上都颇具影响力。

讲座开始后，马传香以大家熟知的目前非常火爆的ChatGPT为引子，引入了GPT（Generative Pre-trained Transformer）的概念，从而引爆了大家对人工智能的好奇，学生都打起十二分精神听马传香讲解。她从GPT这个切入点，讲到GPT所依赖的Transformer框架，到整个Transformer框架的发展和演进，特别是其在大语言模型上的应用。Transformer之所以在大模型的处理中如此受欢迎，一是得益于其自注意力（Self-Attention）机制使得每个时间步的计算只依赖于输入的向量，因此可以实现完全并行的计算，这对于大模型来说，可以极大的减少其迭代周期；第二点就是Transformer自注意力机制能够捕捉长距离的依赖关系，这对于数据量庞大的大模型来说能够更好地构建全局的关系，即拥有宏观观察能力。第三点则是Transformer具有很好的可迁移性，可以通过在大规模数据上进行预训练，然后在其他任务上进行微调，从而提高模型的表现，这使得大模型的适用范围更广，研发周期大大降低。

最后，马传香向大家举了一些大语言模型的应用场景，例如文本分类、命名实体识别、机器翻译、问答系统等。展示了她带领的研究团队所展开的一系列实践探索。并回答了一些学生提出的问题。

精彩的讲座结束了，但是学生们澎湃的心久久停息不下来，大数据、人工智能的发展带给人们的是更加便利便捷的生活，相信我们的同学今后也将投身这个伟大的事业，用科技改变生活，改造世界。

上一篇：“一师一课，教有所长”——数学教研室开展教学分享交流活动

下一篇：汇聚菁英智创未来—— 2023湖北“才聚荆楚·创立方”大学生创业路演周会人工智能专场在信工学院成功举办

教学科研

教学动态

信息工程学院开展“大语言模型原理、演进及应用”学术讲座

友情链接