支持快速索引的高效大数据存储结构OA北大核心CSTPCD
Trie树为处理字符串数据提供了高效的存储和索引。然而,当字符串数据很大时,利用Trie树进行数据存储会导致空间效率变得很低。因此,提出一种支持快速索引的高效大数据存储结构,称为16-bit Trie树,该结构使用16位表示子节点信息,同时用映射表帮助快速索引至指定的子节点,使得16-bit Trie树在处理大数据时仍然具有高效的空间效率。结果表明,16-bit Trie树保留了传统Trie树较高的索引速度,同时提高了其空间效率。与红黑树和B+树相比,16-bit Trie树的插入时间和空间消耗基本相同,但在索引速度上比其快了2倍左右。
肖英;赵林洁;张宇;屈晓芳;
中国计量大学信息工程学院,浙江杭州310018 浙江省电磁波信息技术与计量检测重点实验室,浙江杭州310018杭州代码鸽智能科技有限公司,浙江杭州310018中国计量大学信息工程学院,浙江杭州310018
计算机与自动化
字符串检索Trie树结构字符串处理及索引快速检索
《计算机应用与软件》 2024 (003)
P.28-33 / 6
浙江省自然科学基金项目(Y20F010069)。
评论