基于降噪自编码器特征学习的作者识别及其在《西游记》诗词上的应用OA北大核心CSCDCSTPCD
Author Identification Based on Denoising Autoencoder and It's Application in"Journey to the West"
由于作者归属问题较为复杂,采用传统自然语言处理模型难以完成作者识别.为了深入挖掘作者归属问题,首先采用降噪自编码器深度模型提取文本结构特征,再采用支持向量机分类器完成作者识别.模型的优势在于能够考虑未知文本特征的噪声多样性和复杂性,且能够重构添加噪声的原始文本输入.将该方法应用于吴承恩、王廷陈、薛蕙等人的诗词作者识别,识别准确率最高为78.2%,验证了该方法的有效性,进一步将该方法应用于《西游记》诗词作者识别.
范亚超;罗天健;周昌乐
厦门大学 信息科学与技术学院,福建省类脑计算技术及应用重点实验室,福建 厦门 361005厦门大学 信息科学与技术学院,福建省类脑计算技术及应用重点实验室,福建 厦门 361005厦门大学 信息科学与技术学院,福建省类脑计算技术及应用重点实验室,福建 厦门 361005
信息技术与安全科学
降噪自编码器编码特征作者识别
《厦门大学学报(自然科学版)》 2018 (6)
引入功能语篇分析的汉英语篇统计机器翻译方法研究
884-889,6
国家自然科学基金(61673322,61573294)
评论