基于关键信息增强的中文长文本摘要自动生成OACSTPCD
现有的文本自动摘要方法在处理长文本过程中存在关键信息冗余、准确率低的问题。论文提出一种面向中文长文本的三阶段文本摘要算法,首先利用文本压缩算法对长文本进行固定范围的信息压缩,过滤与主题无关的冗余信息,然后结合预训练模型Bert学习句子深层语义特征,进一步提取主题信息丰富的关键句,最后使用融合指针机制的Seq2Seq模型对关键句进行生成式重写。通过基于真实大规模财经领域长文本数据上的实验,验证了该算法在中文长文本摘要上的有效性。
李永星;黄文明;肖雁南;温雅媛;邓珍荣
桂林电子科技大学计算机与信息安全学院,桂林541004桂林电子科技大学计算机与信息安全学院,桂林541004桂林电子科技大学计算机与信息安全学院,桂林541004广西师范大学电子工程学院,桂林541004桂林电子科技大学计算机与信息安全学院,桂林541004
计算机与自动化
摘要生成长文本压缩预训练摘要生成指针机制
《计算机与数字工程》 2024 (11)
P.3356-3361,6
广西科技厅广西重点研发计划(编号:桂科AB20238013)广西图像图形智能处理重点实验室研究课题(编号:GIIP2011)资助。
评论