首页|期刊导航|计算机技术与发展|CMNER:基于微博的中文多模态实体识别数据集

CMNER:基于微博的中文多模态实体识别数据集OACSTPCD

CMNER:A Chinese Multimodal NER Dataset Based on Weibo

中文摘要

英文摘要

多模态命名实体识别(MNER)旨在通过相关图像的辅助从文本中定位并分类命名实体.目前,中文多模态命名实体识别研究缺乏相关的人工标注数据,限制了中文多模态命名实体识别的发展.该文旨在构建一个基于社交媒体平台的中文MNER数据集,收集了5 000 条微博帖子和18 326 张相应的图像,并人工标注了其中的人名、地名、组织机构名和其他类实体.该文在此数据集上应用了ACN模型和UMT模型进行基线实验.实验结果表明,两个模型的F1 值分别达到了74.22%…查看全部>>

Multimodal Named Entity Recognition(MNER)is a pivotal task designed to extract and classify named entities from text with the assistance of pertinent images.Nonetheless,a notable paucity of manual annotation data for Chinese MNER has considerably impeded the progress of Chinese multimodal named entity recognition.We compile a Chinese Multimodal NER dataset(CMNER)utilizing data sourced from social media platform,encompassing 5 000 Weibo posts paired with 18 3…查看全部>>

作者：季源泽;李霏

作者单位：武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室,湖北武汉 430072武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室,湖北武汉 430072

分类：计算机与自动化

中文关键词：多模态命名实体识别图像命名实体中文跨语言

英文关键词：multimodal named entity recognitionimagenamed entityChinesecross-lingual

刊名：《计算机技术与发展》 2024 (10)

页码/页数：110-117,8

基金：国家重点研发计划(2022YFB3103602)湖北省自然科学基金(2021CFB385)

DOI：10.20165/j.cnki.ISSN1673-629X.2024.0203

您当前未登录！

去登录

点击加载更多...

CMNER:基于微博的中文多模态实体识别数据集OACSTPCD

CMNER:A Chinese Multimodal NER Dataset Based on Weibo

评论