首页|期刊导航|情报杂志|基于关键词扩展的社会化问答社区短文本分类研究--以法律问答社区为例

基于关键词扩展的社会化问答社区短文本分类研究--以法律问答社区为例OA北大核心CHSSCDCSSCICSTPCD

中文摘要

[研究目的]将关键词词向量特征扩展方法应用于社会化问答社区的短文本分类,解决问题短文本特征稀疏和语义不明确的缺陷,提高问答社区的信息服务质量。[研究方法]结合TF-IDF与Word2vec扩展关键词特征,以增强短文本的语义信息。将CNN特征提取、BiLSTM上下文信息捕捉和Attention权重分配的优势相结合,构建CNN-BiLSTM-Attention模型。以爬取到的“找法网”数据集为例,经过关键词词向量特征扩展后,利用CNN-BiLSTM-Attention模型实现法律问答社区短文本的有效分类。[研究结论]通过在8个法律主题上的实证研究表明,关键词扩展后的分类效果高于扩展前,且关键词扩展数量达到13个时分类效果最优;利用CNN-BiLSTM-Attention模型对扩展后的法律问答短文本进行分类,分类准确率达到97.63%,与其他几种分类器相比,该模型的分类准确率平均高出1.08%。

臧志栋;韩挺;李秀霞;

扬州大学社会发展学院,扬州225009曲阜师范大学传媒学院,日照276826

特征扩展社会化问答社区短文本分类深度学习CNN-BiLSTM-Attention模型

《情报杂志》 2024 (012)

P.178-185 / 8

国家社会科学基金资助项目“跨学科知识元迁移组合与学术创新机会发现研究”(编号:22BTQ061);江苏省研究生科研创新计划资助项目“数智时代学科知识融合与应用创新路径研究”(编号:KYCX24_3693)研究成果。

10.3969/j.issn.1002-1965.2024.12.023

评论