短文本新闻标题生成方法OA
当今新闻具有文本短、发布频繁、时效性强等特点,一个媒体账号一天内发布数十条新闻。为大量新闻制定适用且有吸引力的标题已经成为媒体工作者的一项主要工作内容。媒体工作者需要一个自动生成短文本标题的系统来缓解工作压力。为解决该问题,文中提出了一种短文本新闻标题生成模型。该模型采用序列到序列结构,在编码器和解码器分别应用预训练语言模型和分层自注意力解码器。为了使生成标题包含原始新闻的关键信息,提出一种基于LCSTS数据集和Weibo4数据集的分阶段训练方法,并使模型分别从这两个数据集学习提取关键新闻信息和构建风格化表达,使模型生成标题能够准确表达新闻的核心内容从而吸引读者。
赵明;
福建省龙岩市新罗区教育局网络中心,福建龙岩364099
计算机与自动化
新闻标题生成预训练语言模型分层自注意力解码器编码器文本提取文本生成
《电子科技》 2024 (009)
P.87-94 / 8
国家重点研发计划(2022YFF0903404)。
评论