| 注册
首页|期刊导航|数据与计算发展前沿|NKCorpus:利用海量网络数据构建大型高质量中文数据集

NKCorpus:利用海量网络数据构建大型高质量中文数据集

李东闻 钟震宇 申峻宇 王昊天 孙羽菲 张玉志

数据与计算发展前沿2022,Vol.4Issue(3):30-45,16.
数据与计算发展前沿2022,Vol.4Issue(3):30-45,16.DOI:10.11871/jfdc.issn.2096-742X.2022.03.003

NKCorpus:利用海量网络数据构建大型高质量中文数据集

NKCorpus: Extracting High Quality Large Chinese Dataset from Web Data

李东闻 1钟震宇 1申峻宇 1王昊天 1孙羽菲 1张玉志1

作者信息

  • 1. 南开大学,软件学院,天津 300350
  • 折叠

摘要

关键词

自然语言处理/中文数据集/数据集构建

引用本文复制引用

李东闻,钟震宇,申峻宇,王昊天,孙羽菲,张玉志..NKCorpus:利用海量网络数据构建大型高质量中文数据集[J].数据与计算发展前沿,2022,4(3):30-45,16.

基金项目

国家重点研发计划(2021YFB0300104) (2021YFB0300104)

数据与计算发展前沿

OACSCD

2096-742X

访问量5
|
下载量0
段落导航相关论文