相关度
- 相关度
- 发表时间
每页显示10条
- 每页显示10条
- 每页显示20条
- 每页显示30条
已找到 119 条结果
- 基于Transformer的DGA域名检测方法北大核心CSCDCSTPCD摘要:已有DGA检测方法已经获得了较高的检测精度,但在缩略域名上存在误报率高的问题.主要原因是缩略域名字符间随机性高,现有检测方法从随机性角度很难有效地区分缩略域名和DGA域名.在分析了缩略域名的字符特性后,基于自注意力机制实现了域名字符依赖性的检测;并采用LSTM改进了Transformer模型的编码方式,以更好地捕获域名中字符位置信息;基于Transformer模型构建了DGA域名检测方法(MHA).实验结果表明,MHA可以有效地区分出…查看全部>>
- 基于情感词典和Transformer模型的情感分析算法研究北大核心CSTPCD摘要:随着情感分析研究的不断深入,情感词典和深度学习技术被广泛地应用于情感分析任务中.针对情感词典不能考虑词的上下文语义信息,循环神经网络获取整个句子序列信息有限和网络在反向传播时梯度消失或梯度爆炸问题,提出一种基于情感词典和Transformer的文本情感分析方法.该方法不仅可以充分地利用情感词典的特征信息,还能将与情感词相关联的其他词融入到该情感词中,帮助情感词更好地编码.此外,该方法还能够更专注于情感词的不同位置,更好地理解输入句子的…查看全部>>
- 结合Transformer模型与深度神经网络的数据到文本生成方法北大核心CSCDCSTPCD摘要:数据到文本的生成是指从结构化数据生成连贯文本的一种自然语言处理方法.近年来,由于端到端训练的深度神经网络的应用,数据到文本生成的方法显示出了巨大潜力.该方法能够处理大量数据自动生成连贯性文本,常用于新闻写作、报告生成等场景.然而,已有研究中对于数据中具体数值、时间等数据信息的推理存在较大缺陷,无法充分利用数据间的结构信息给出合理的生成指引,并且生成过程容易出现语义与句法分离训练的问题.因此,文中提出一种结合Transformer模型与…查看全部>>
- 时间序列预测与深度学习:文献综述与应用实例北大核心CSTPCD摘要:随着深度学习与时间序列传统模型的融合发展,通过利用大量可用数据在整个时间序列集合中估计全局模型的参数,使得传统的局部建模方法得到了实质性的改进.介绍近年来提出的与深度学习相结合的时间序列预测方法及三种时间序列预测模型:深度状态空间模型(DSSM),深度自回归模型(DeepAR),Transformer模型.采用GluonTS时间序列预测框架对上海市出口额数据进行预测并给出效果评估.实验结果表明,基于深度学习的时间序列…查看全部>>
- 基于Transformer局部信息及语法增强架构的中文拼写纠错方法北大核心CSCDCSTPCD摘要:针对中文拼写纠错,提出两种新的改进方法.其一,在Transformer注意力机制的基础上,添加高斯分布的偏置矩阵,用于提高模型对局部文本的关注程度,加强对错误文本中错误字词和周边文字的信息提取.其二,使用ON_LSTM模型,对错误文本表现出的特殊语法结构特征进行语法信息提取.实验结果表明,所提出的两种方法均能有效提高准确率和召回率,并且,将两种方法融合后的模型取得最高F1值.
- 基于"Four-hot"编码和Transformer-LSTM模型的船型识别方法摘要:为克服依靠图像数据进行识别的局限,使用航迹数据和深度学习方法是当前船型识别的热门方案.针对船型识别任务中常用的长短时记忆(Long Short Term Memory,LSTM)网络对航迹数据特征提取的性能饱和问题,提出了一种基于"Four-hot"编码和Transformer-LSTM神经网络模型的船型识别方法.首先将航迹数据编码为"Four-hot"向量形式;然后构建由Transformer编码模块和LSTM网络级联的Transf…查看全部>>
- 基于小波分析的Arima-Transformer组合模型的比特币价格预测摘要:金融商品价格作为一种经典的时间序列,其变化通常表现为非线性、非平稳性及高波动性,使用单一的模型较难实现对金融商品价格的准确预测。文章基于小波分析建立ARIMA-Transformer组合模型,从不同维度分析时间序列的随机波动、循环变化、周期变化等变化规律,对比特币的价格进行时间窗口滚动式预测,预测结果与实际的比特币价格走势大致相同,表明该模型可作为交易者的参考投资模型。
- 采用融合规则与BERT-FLAT模型对营养健康领域命名实体识别北大核心CSCDCSTPCD摘要:人类营养健康命名实体识别旨在检测营养健康文本中的营养实体,是进一步挖掘营养健康信息的关键步骤.虽然深度学习模型广泛应用在人类营养健康命名实体识别中,但没有充分考虑到营养健康文本中含有大量的复杂实体而出现长距离依赖的特点,且未能充分考虑词汇信息和位置信息.针对人类营养健康文本的特点,该研究提出了融合规则与BERT-FLAT(Bidirectional Encoder Representations from Transfromers-F…查看全部>>
- 基于Informer的长序列时间序列电力负荷预测摘要:针对长时间序列电力负荷的预测精度低的问题,应用了基于Informer长时间序列模型的电力负荷预测方法.该方法通过Informer模型中的自注意力蒸馏机制,使得每层的解码器都将输入序列的长度缩短一半,从而极大地节约了Encoder内存开销,并在编码器结构中使用生成式结构,使得预测解码时间极大的缩短;以澳大利亚的电力负荷数据作为测试用例,并与长短时记忆神经网络(long-short term memory,LSTM)和卷积神经网络(con…查看全部>>
- 基于情感分析和Transformer模型的微博谣言检测CSTPCD摘要:针对微博文本以实现谣言检测为目标,深度挖掘微博正文内容的语义信息,并且着重强调用户在微博评论中体现的情感倾向性,提升谣言识别效果.为提高谣言检测的准确率,采取基于XLNet的词嵌入方法,使用Transformer的En-coder的模型提取微博正文内容的语义特征,并结合BiLSTM+Attention网络实现微博评论的情感特征的提取,将2种特征向量进行拼接融合,进一步丰富神经网络的输入特征,之后输出微博事件的分类结果,进而实现微博谣言…查看全部>>