10月18日下午,为了开拓学生视野、了解前沿技术发展状况和发展趋势,更好的培养专业型人才,信息工程学院邀请了湖北大学计算机与信息工程学院教授、硕士生导师马传香教授在学院楼4203室为信息工程学院师生开展了题为“大语言模型原理、演进及应用”的学术讲座。本次讲座由我院彭庆喜教授主持,信息工程学院部分老师出席,并在课上引起了很多同学的讨论和提问。
讲座开始前,彭庆喜对马传香教授的学术研究背景做了简要介绍,马传香博士毕业于华中科技大学计算机软件与理论专业,是武汉爱迪科技有限责任公司科技副总。马传香从事数据挖掘、人工智能相关方向的研究和应用工作已有多年,经验丰富;同时参与的基金项目、发明的专利、发表的论文不仅从数量上更从质量上都颇具影响力。
讲座开始后,马传香以大家熟知的目前非常火爆的ChatGPT为引子,引入了GPT(Generative Pre-trained Transformer)的概念,从而引爆了大家对人工智能的好奇,学生都打起十二分精神听马传香讲解。她从GPT这个切入点,讲到GPT所依赖的Transformer框架,到整个Transformer框架的发展和演进,特别是其在大语言模型上的应用。Transformer之所以在大模型的处理中如此受欢迎,一是得益于其自注意力(Self-Attention)机制使得每个时间步的计算只依赖于输入的向量,因此可以实现完全并行的计算,这对于大模型来说,可以极大的减少其迭代周期;第二点就是Transformer自注意力机制能够捕捉长距离的依赖关系,这对于数据量庞大的大模型来说能够更好地构建全局的关系,即拥有宏观观察能力。第三点则是Transformer具有很好的可迁移性,可以通过在大规模数据上进行预训练,然后在其他任务上进行微调,从而提高模型的表现,这使得大模型的适用范围更广,研发周期大大降低。
最后,马传香向大家举了一些大语言模型的应用场景,例如文本分类、命名实体识别、机器翻译、问答系统等。展示了她带领的研究团队所展开的一系列实践探索。并回答了一些学生提出的问题。
精彩的讲座结束了,但是学生们澎湃的心久久停息不下来,大数据、人工智能的发展带给人们的是更加便利便捷的生活,相信我们的同学今后也将投身这个伟大的事业,用科技改变生活,改造世界。