数据与计算发展前沿2022,Vol.4Issue(3):30-45,16.DOI:10.11871/jfdc.issn.2096-742X.2022.03.003
NKCorpus:利用海量网络数据构建大型高质量中文数据集
NKCorpus: Extracting High Quality Large Chinese Dataset from Web Data
摘要
关键词
自然语言处理/中文数据集/数据集构建引用本文复制引用
李东闻,钟震宇,申峻宇,王昊天,孙羽菲,张玉志..NKCorpus:利用海量网络数据构建大型高质量中文数据集[J].数据与计算发展前沿,2022,4(3):30-45,16.基金项目
国家重点研发计划(2021YFB0300104) (2021YFB0300104)