|国家科技期刊平台
首页|期刊导航|南方农业学报|伊丽莎白安格斯三角梅转录组的SSR、SNP和InDel特征分析

伊丽莎白安格斯三角梅转录组的SSR、SNP和InDel特征分析OA北大核心CSTPCD

中文摘要

【目的】基于转录组测序数据分析伊丽莎白安格斯三角梅SSR、SNP和InDel位点特征,为开发三角梅分子标记、选育无刺或少刺品种、品种鉴定及亲缘关系分析提供理论依据。【方法】以伊丽莎白安格斯三角梅3个时期的枝刺和茎段为材料,对其进行转录组测序,采用Trinity对获得的高质量测序数据进行序列组装,利用MISA和GATK3对SSR、SNP和InDel进行特征分析。【结果】18个样本转录组测序平均获得45905982bpRawdata,质控过滤后获得45640193 bp Clean data,拼接后获得312812条转录本和144512条Unigenes,有54516个SSR位点分布于40820条Unigenes上,发生频率为28.25%,平均分布距离为2.67kb,包含1个以上SSR位点的Unigenes10269条,占Unigenes总数的4.25%。在重复基元类型中,单核苷酸、二核苷酸和三核苷酸重复数量占优势,其中单核苷酸重复数量最多(39904个,占比73.20%),其次为二核苷酸重复(8169个,占比14.98%)和三核苷酸重复(5899个,占比10.82%),五核苷酸重复最少(31个,占比0.06%)。单核苷酸~六核苷酸重复类型共检测到98种重复基元,出现频率为0.01%~25.71%,其中出现频率最高的基元为A/T(37151个),占SSR位点总数的68.15%。SSR各类型重复基元的重复次数集中在5~23次,SSR序列的长度10~60bp,平均长度为20.38bp。共检测到231248个SNP位点和99580个InDel位点,其中SNP位点平均分布距离为1.59 kb,InDel位点平均分布距离为0.68 kb,且均以含1个位点的Unigenes数量最多,Unigenes数量随SNP和InDel位点数量的增加而逐渐减少。【结论】伊丽莎白安格斯三角梅转录组中SSR位点数量多、类型丰富,分布特征明显,可用于开发大量SSR标记,SNP和InDel位点发生频率低于模式植物,有待深度挖掘。

孙利娜;林茂;黄旭光;陈尔;杨舒婷;王华新;龚建英;

广西林业科学研究院,广西南宁530002南宁市园林科研所,广西南宁530012

园艺学与植物营养学

伊丽莎白安格斯三角梅转录组SSRSNPInDel

《南方农业学报》 2024 (003)

P.745-753 / 9

广西自然科学基金项目(2020GXNSFAA297064);广西林业科技推广示范项目(桂林科研[2022]第11号);广西林业科技推广示范项目(2023GXLK29)。

10.3969/j.issn.2095-1191.2024.03.015

评论