基于序列到序列模型的无监督文本简化方法OA北大核心CSCDCSTPCD
Unsupervised text simplification with sequence-to-sequence model
训练基于序列到序列(seq2seq)的文本简化模型需要大规模平行语料库,但是规模较大且标注质量较好的语料却难以获得.为此,提出一种无监督文本简化方法,使模型的学习仅需要无标注的复杂句和简单句语料.首先,利用去噪自编码器(denoising autoencoder)分别从简单句语料和复杂句语料中学习,获取简单句的自编码器和复杂句的自编码器;然后,组合两个自编码器形成初始的文本简化模型和文本复杂化模型;最后,利用回译策略(back-translati…查看全部>>
李天宇;李云;钱镇宇
扬州大学信息工程学院,江苏扬州225137扬州大学信息工程学院,江苏扬州225137扬州大学信息工程学院,江苏扬州225137
信息技术与安全科学
文本简化无监督序列到序列模型去嗓自编码器
《计算机应用研究》 2021 (1)
93-96,100,5
国家自然科学基金资助项目(61703362)江苏省研究生科研与实践创新计划项目(SJCX19_0888)