计算机工程2010,Vol.36Issue(6):102-104,3.
基于内容相似度的网页正文提取
Web Page Main Text Extraction Based on Content Similarity
摘要
关键词
网页正文抽取/网页映射/网页清洗/文本相似度Key words
Web page main text extraction/Web page mapping/Web page cleaning/text similarity分类
信息技术与安全科学引用本文复制引用
王利,刘宗田,王燕华,廖涛..基于内容相似度的网页正文提取[J].计算机工程,2010,36(6):102-104,3.基金项目
国家自然科学基金资助项目(60575035,60975033) (60575035,60975033)
上海市重点学科建设基金资助项目(J050103) (J050103)
上海大学研究生创新基金资助项目(SHUCX092162) (SHUCX092162)