一种面向催化材料领域的文献信息抽取方法OA
为有效利用PDF文献中的非结构化文本数据,面向费托合成催化材料领域文献,设计了关键信息抽取流水线从PDF文献中抽取表格及其相应注释等关键信息。以微分二值化网络(differentiable binarization network, DBNet)为基准模型,通过引入自适应空间注意力(adaptive spatial attention, ASA)模块,提出了DB-ASA文本检测模型,提高了检测精度。采用单视觉文本识别模型(scene text r…查看全部>>
高强;张仰森;孙圆明;贾启龙
北京信息科技大学智能信息处理实验室,北京100192北京信息科技大学智能信息处理实验室,北京100192北京信息科技大学智能信息处理实验室,北京100192北京信息科技大学智能信息处理实验室,北京100192
计算机与自动化
催化材料费托合成信息抽取文本识别
《北京信息科技大学学报(自然科学版)》 2024 (2)
P.50-56,7
北京材料基因工程高精尖创新中心项目。
评论