首页|期刊导航|计算机与数字工程|基于关键信息增强的中文长文本摘要自动生成

基于关键信息增强的中文长文本摘要自动生成OACSTPCD

中文摘要

现有的文本自动摘要方法在处理长文本过程中存在关键信息冗余、准确率低的问题。论文提出一种面向中文长文本的三阶段文本摘要算法,首先利用文本压缩算法对长文本进行固定范围的信息压缩,过滤与主题无关的冗余信息,然后结合预训练模型Bert学习句子深层语义特征,进一步提取主题信息丰富的关键句,最后使用融合指针机制的Seq2Seq模型对关键句进行生成式重写。通过基于真实大规模财经领域长文本数据上的实验,验证了该算法在中文长文本摘要上的有效性。

李永星;黄文明;肖雁南;温雅媛;邓珍荣

桂林电子科技大学计算机与信息安全学院,桂林541004桂林电子科技大学计算机与信息安全学院,桂林541004桂林电子科技大学计算机与信息安全学院,桂林541004广西师范大学电子工程学院,桂林541004桂林电子科技大学计算机与信息安全学院,桂林541004

计算机与自动化

摘要生成长文本压缩预训练摘要生成指针机制

《计算机与数字工程》 2024 (11)

P.3356-3361,6

广西科技厅广西重点研发计划(编号:桂科AB20238013)广西图像图形智能处理重点实验室研究课题(编号:GIIP2011)资助。

10.3969/j.issn.1672-9722.2024.11.031

评论