首页|期刊导航|广西民族大学学报(自然科学版)|基于Sailor2和RAG的东博会新闻问答系统

基于Sailor2和RAG的东博会新闻问答系统OA

中文摘要

该文以中国—东盟博览会新闻为研究对象,结合开源的东南亚多语言大语言模型Sailor2与检索增强生成技术,构建了一个高效的多语种新闻问答系统。该研究采用的核心技术包括:基于多策略的新闻文本分块方法、融合密集向量与稀疏向量的混合检索机制,以及基于语义相似度的路由策略。系统性能评估方面,采用DeepEval框架从上下文精确度、上下文召回率、回答相关度和可信度4个维度进行了全面评估。实验结果表明,在语义分块策略下,该系统在上下文精确度、上下文召回率、回答相关度等指标上得到了较好的提升。同时,该系统能够支持中文、泰语、越南语等多种语言的问答,展现出良好的跨语言能力。该研究丰富了大语言模型在新闻领域的应用案例,为中国—东盟博览会相关新闻的多语种智能问答提供了一种可行的技术路径。

秦董洪;顾佳凯;裴胜玉;蒋玉桂

广西民族大学人工智能学院,广西南宁530006广西民族大学人工智能学院,广西南宁530006广西民族大学人工智能学院,广西南宁530006广西民族大学研究生院,广西南宁530006

信息技术与安全科学

大语言模型检索增强生成多语种新闻问答中国—东盟博览会

《广西民族大学学报(自然科学版)》 2025 (2)

P.83-91,9

广西壮族自治区中央引导地方科技发展资金项目(桂科ZY24212045)广西科技基地和人才专项(桂科AD23026054)。

评论