北京理工大学珠海学院
2022
届本科生毕业论文
基于自然语言处理的中文新闻标题生成
摘
要
在这个信息爆炸的时代,打开手机电脑就能接收到铺天盖地的新闻。但是在时
间和精力都有限的情况下,用户要想快速筛选出符合自身取向、有价值的新闻,新
闻标题就成为一个重要参考。新闻标题相当于新闻的精简版摘要,通过阅读标题用
户可以大致了解新闻的内容,从而根据自身取向决定是否花费时间阅读这篇新闻。
本文基于
GPT2
模型实现根据新闻文本生成标题。选取新浪微博的新闻作
为数据集,对数据集进行预处理后用于训练和测试模型。
基于自然语言处理的中文新闻标题生成-15872字.docx