文章标题:Chromosome-level genome assemblies of two littorinid marine snails indicate genetic basis of intertidal adaptation and ancient karyotype evolved from bilaterian ancestors
合作单位:中国科学院海洋研究所
发表期刊:GigaScience
影响因子:11.8
研究对象:短滨螺和中华滨螺
百迈客生物为该研究提供了基因组测序服务。
滨螺栖息于岩相潮间带,受到海洋和陆地环境的双重影响,需要根据潮水涨落的节律适应水生和陆生两种完全不同的生境,其广布性、高丰度和对于环境因子胁迫多样且高变动的潮间带环境良好的适应性,使其成为研究环境适应、生物进化和物种形成的潜在模式生物,也是探究生物对于环境压力变化快速响应机制的优良范本,相关的生物学、分类学、系统发育学和生态学研究已经大量开展。此外,细胞遗传学研究结果显示,滨螺具有17条染色体,与两侧对称动物的祖先染色体(ALG)数目一致,因此推演二者之间的核型演化历程具有重要的进化生物学意义。然而由于基因组测序和组装技术的限制,目前滨螺科基因组资源十分匮乏,极大地阻碍了相关研究的顺利开展。
该研究基于三代长读长测序、二代测序和Hi-C测序数据,构建了短滨螺和中华滨螺染色体水平基因组参考序列,并完成了基因结构和功能注释。组装得到两种滨螺基因组大小在900Mb左右,contig N50为3.43Mb和2.31Mb,并成功挂载到17条染色体上,BUSCO评估得分均在93%以上。两个滨螺高质量基因组参考序列作为重要的基因组资源,对于滨螺科及软体动物门系统发育、进化基因组学和生态学等研究都具有十分重要的意义。
通过比较基因组学分析构建了包括两种滨螺在内的11个物种的系统发育树,并估算两种滨螺的分化时间大约在128.22Mya前。进一步的研究结果表明与刺激反应、代谢过程、先天免疫和抗氧化反应相关的基因或基因家族可能在滨螺应对潮间带多种环境因子胁迫的过程中发挥着重要作用,受损核酸和蛋白的修复或降解可能是滨螺在多重压力下抵抗细胞凋亡、维持细胞内稳态的主要方式。相关研究结果为潮间带无脊椎动物适应性进化分子机制的后续研究提供了基础。
宏观共线性分析结果表明滨螺17条染色体可能由17条ALG经过4次染色体分裂和4次染色体融合演化而来,并推演了由ALG演化到双壳-腹足共同祖先再到滨螺和扇贝的简约演化历程,表明两侧对称动物祖先的基因连锁群在经过上亿年的演化之后在现存物种中仍然得以保留,为未来双壳-腹足共同祖先核型的构建和核型进化速率影响因素的研究提供了参考。
内容来源于中国科学院海洋研究所
]]>文章通过构建本氏烟草端粒到端粒无缺口基因组,对本氏烟草进行了亚基因组分型,进一步确定林烟草(N. sylvestris)和渐狭叶烟草(N. attenuata)最可能是其二倍体祖先物种。研究还深入解析了异源四倍体本氏烟草的着丝粒序列及其表观特征,丰富了我们对本氏烟草基因组进化和着丝粒演化过程的认识。
文章标题:The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres
合作单位:北京大学现代农业研究院
发表期刊:Nature Plants
研究对象:本氏烟草
百迈客生物为该研究提供了PacBio HiFi、Hi-C、Illumina和RNA-seq测序服务。
本氏烟草(Nicotiana benthamiana)是一年生茄科烟草属植物,原产于澳大利亚北部地区,和用于制作香烟的普通烟草(N. tabaccum)是近缘物种。本氏烟草最为人知的是作为植物学和合成生物学研究的模式植物。本氏烟草凭借其对病毒的易感性和在瞬时基因表达的便利性成为了植物科学家的“宠儿”,同时它也是植物天然产物和疫苗异源合成的重要底盘生物。因此,解析本氏烟草的基因组密码对促进植物科学研究和生物制药产业具有重要的价值。本氏烟草是异源四倍体,由两个二倍体祖先在距今500万年-600万年杂交形成,之后基因组演化形成现今的19对染色体。本氏烟草基因组约为2.85Gb,其草图最早发表于2012年,之后的12年间多个改进版本的本氏烟草基因组陆续公布,组装质量有了很大提升,但仍然存在多个缺口与组装注释错误,严重影响了对这一模式生物的功能基因组学的研究进程。
着丝粒是负责细胞分裂过程中染色体平均分配给子细胞的基因组关键区域,也被称为基因组的暗物质区域。因其高度复杂并富含重复序列,着丝粒的序列很难被测序和破译。近年来随着测序技术和生物信息算法的快速发展,包括人类、拟南芥、酵母在内的多个模式生物以及玉米、水稻、辣椒、生菜等作物的着丝粒特征逐渐被揭示。这丰富了我们对这些基因组暗物质的认知,为疾病研究和治疗、作物单倍体育种、人工染色体合成等前沿科学提供理论指导。然而,我们对生物界着丝粒的结构和进化理解仍然处在初期,绝大多数生物的着丝粒区域仍未解析。此外,多倍体生物例如四倍体本氏烟草、四倍体马铃薯、六倍体小麦等,基因组经历了复制、重排和结构变异等事件,在此过程中着丝粒如何演化和维持功能也有待阐明。异源四倍体的本氏烟草为这些问题的解答提供了一个理想的模型。
研究团队首先采用单分子测序技术(HiFi,116.7x?+ ONT ultra-long,47.9x),Hi-C(150x)和Bionano(329.6x)光学图谱等多种技术相结合策略,构建了T2T无缺口的本氏烟草基因组(2.85 Gb),实现所有染色体的完整分型组装(图1),并鉴定到所有19个着丝粒和38个端粒,contig N50值达到146.4 Mb。随后的质量评估表明该基因组具有很高的碱基准确性和组装完整性。
研究团队还进一步基于着丝粒特异结合蛋白CENH3的ChIP-seq数据,确定了本氏烟草基因组的完整着丝粒序列,并揭示了其着丝粒全景特征。令人惊讶的是,与辣椒和马铃薯等茄科作物的着丝粒(以LTR/Gypsy反转录转座子为主)不同,本氏烟草着丝粒不仅有Gypsy序列,而且存在大量的卫星(Satellite)DNA的重复阵列,暗示这些着丝粒特异的卫星重复序列是在本氏烟草中新出现的(图2)。经过仔细分析,研究团队证明了本氏烟草着丝粒卫星阵列可能起源于核糖体DNA的基因间间隔序列。
此外,在着丝粒组蛋白CENH3优先占据的区域,Gypsy反转录转座子和核基因组线粒体插入序列(NUMT)广泛侵入本氏烟草着丝粒,表明这些DNA元件在着丝粒功能中起着至关重要的作用。有趣的是,NUMT在本氏烟草着丝粒中的插入具有很强的亚基因组偏好性,并且主要与母体着丝粒周围有关。亚基因组分析表明,卫星阵列的出现可能推动了多倍体后着丝粒的形成(图2)。
最后,该研究提出一个模型来解释本氏烟草着丝粒的进化,即本氏烟草基因组在多倍化后通过新着丝粒形成、卫星序列扩展、反转录转座子的富集和NUMT整合而实现着丝粒进化(图1),丰富了我们对于茄科植物和多倍体植物着丝粒演化的认知。
该研究公布了模式植物本氏烟草的T2T无缺口基因组,并揭示了其着丝粒的全景结构及其表观遗传特征,该研究成果具有里程碑意义。本氏烟草完整基因组的破译不但为植物科学研究提供了重要的遗传资源,也将促进本氏烟草作为模式和底盘植物在生物技术领域的广泛应用。
内容来源于北京大学现代农业研究院,侵删
]]>发表期刊:Poultry Science
影响因子:3.8
发表单位:南京农业大学,西藏农牧学院等
研究对象:金陵白鸭
研究方法:全基因组关联分析(GWAS)
百迈客生物为该研究提供了全基因组关联分析(GWAS)测序及部分数据分析服务。
鸭子为人类消费提供肉、蛋、羽毛等产品,中国是世界上最大的鸭肉消费国。金陵白鸭做为我国优质的选育品种,具有优良的生长速度和肉质品质。从孵化到上市的整个时期,鸭子的体重逐渐增加,这一过程由复杂的生理和生化机制调控,器官和骨骼的发育是体重增加的关键因素,全基因组关联分析(GWAS)是许多牲畜和家禽物种研究生长和发育的遗传机制的常用方法,然而,现有的一些关于鸭生长发育性状的GWAS研究测序深度较低,发现的候选基因很少。
201只雄鸭全基因组测序深度为10×;
GWAS分析:表型:出生体重(BWB)、1周体重(BW1)、3周体重(BW3)、5周体重(BW5)和7周体重(BW7)分析模型:FaST-LMM;EMMAX;LMM;LM 阈值线:log10(p)=5如果一个SNP在2个或更多的模型中被关联,作者认为它是一个与特定性状相关的高可信度SNP。
进化分析:进化树构建;群体结构分析;PCA分析;LD衰减分析等
1.金陵白鸭群体体重表型统计
该研究对金陵白鸭(n = 201)在不同时期的体重进行统计,BWB、BW1、BW3、BW5和BW7的体重均值分别为46.93g、127.19g、697.17g、1182.43g和1,888.52g。生长曲线结果显示:金陵白鸭第3周-第5周生长最快,第5周后生长放缓。体重的分散度随着年龄和体重的增加而增加。相邻2周的体重之间存在较强的相关性,BW3与BW1(r = 0.6)、BW5(r = 0.68)和BW7(r = 0.6)显著正相关,BW5与BW7显著正相关(r = 0.82)。但随着时间间隔的延长,性状间的相关性降低,BW1与BW7的相关性不显著(r = 0.21),BWB则与BW3 (r = 0.18), BW5 (r = 0.058),BW7 (r = 0.45)均不显著相关。
2.金陵白鸭系统发育、群体遗传结构解析
虽然该研究只有金陵白鸭一个种群,但考虑到繁殖过程中种群分层的潜力,作者进行了系统发育和群体结构分析。系统发育树和PCA结果显示,金陵白鸭可分为5个种群,群体结构表明,当K=6时分群结果最佳,金陵白鸭种群具有丰富的遗传多样性,总SNPs的平均R2为0.24,当R2=0.2,LD的衰减距离约为30kbp。
3.GWAS分析
该研究对基于测序产生的2,610.50 Gbp的clean data进行分析,Q30为95.55%,样本与参考基因组平均比对率为99.59%,平均覆盖深度为10×,基因组覆盖度为96.51%。作者利用,797,309,337个SNPs,4种关联模型进行后续GWAS分析,其中95个SNP与BWB性状显著相关,这些SNP主要分布在1号染色体和4号染色体上。通过筛选和注释,共检测到5个相关的候选基因:PUS7、FBXO11、FOXN2、MSH6、SLC4A4。针对BW1性状,作者发现了101个与BW1性状显著相关的SNPs,这些SNP主要分布在7号染色体上,共检测到2个与BW1性状相关的候选基因:RAG2和TMEFF2。针对BW3性状,作者发现了112个显著SNPs。这些SNP主要分布在1号染色体和11号染色体上。通过筛选和注释,共检测到4个与BW3性状相关的候选基因:?STARD13、Klotho、ZAR1L和TLE3。同时确定了92个与BW5性状相关SNPs,这些SNP主要分布在1号染色体和2号染色体上,通过注释STARD13、Klotho和ZAR1L与BW5性状相关。此外,作者还鉴定了新的候选基因:KAT2B、KCNH8和SATB1。
BW7性状与33个SNP关联,这些SNP主要分布在1号染色体和2号染色体上。通过筛选和注释,共检测到6个与BW7性状相关的候选基因:PLXNC1、ATP1A1、CD58、FRYL、OCIAD1和OCIAD2。在分析的四个模型的结果,LM识别出了更多的显著位点,曼哈顿图显示出更高的峰值。然而,QQ-plot显示,LM模型中的大部分站点都位于对角线上方,可能具有较高的假阳性。其余3个模型的结果均表现出一致性,而QQ-plot的结果则优于LM模型。
金陵白鸭是一种新开发的品种,因其生长速度快,肉质优良的特点,使其具有重要的经济价值和研究潜力;然而,人们对其体重性状的遗传基础尚不太清楚。该研究对201只金陵白公鸭进行了全基因组重测序,并进行了群体基因组分析,表明金陵白鸭种群具有丰富的遗传多样性。
作者对出生体重(BWB)、1周体重(BW1)、3周体重(BW3)、5周体重(BW5)和7周体重(BW7)进行了全基因组关联分析,4种统计模型比较研究表明,FaST-LMM表现出最优的效率,产生更多的结果和最小的假阳性。
作者发现,PUS7、FBXO11、FOXN2、MSH6和SLC4A4均与BWB相关。RAG2和TMEFF2是BW1的候选基因,STARD13、Klotho、ZAR1L可能是BW3和BW5的候选基因。PLXNC1、ATP1A1、CD58、FRYL、OCIAD1和OCIAD2与BW7相关。这些研究结果为金陵白鸭的选择和育种提供了遗传参考,同时也加深研究者们对白鸭生长发育表型的认识。
]]>期刊名称:Nature Genetics
合作单位:北京大学现代农业研究院
发表时间:2024年7月8日
影响因子:31.7
研究对象:西瓜
测序技术:HIC测序
百迈客生物为该研究提供HIC等建库测序服务。
泛基因组是一个物种中所有个体基因组信息的总和,构建泛基因组可以有效解决单一参考基因组带来的信息缺失和分析偏差。而超级泛基因组则代表一个属内所有物种的基因组信息,尤其蕴含了野生种中丰富的基因组变异,是对泛基因组的进一步扩展,在远缘杂交和基因发掘等方向具有重要应用前景。
西瓜是世界重要的园艺经济作物之一,富含抗氧化剂番茄红素和增强血液循环的瓜氨酸,口味甘甜,享有夏季”水果之王”的美誉,深受全球消费者喜爱。西瓜全球年产量接近1亿吨,我国作为种瓜和吃瓜第一大国,生产和消费了全球总量的60%以上,西瓜产业在乡村振兴和农民致富中占有十分重要的作用。我国西瓜产业的迅速发展离不开优良的品种?,依靠一代代育种家的不懈努力,我国成为世界上西瓜种质创新和品种选育最为活跃的国家,在品种种源方面实现了完全自主可控。随着气候变化的加剧和病虫危害的日益严重,西瓜生产面临着严重的挑战。在现有优良品种的基础上,“植入”缺少的抗病耐逆优良基因,是西瓜种质创新的关键问题,对维持我国西瓜产业高质量绿色发展十分重要。栽培西瓜在驯化和品种改良过程中因为对品质和产量的追求,导致遗传多样性非常狭窄,抗病耐逆基因大量丢失,而在西瓜的祖先即野生西瓜中存在广泛的遗传与表型多样性,具有丰富的抗病耐逆等基因资源,是西瓜遗传改良和种质创新的宝库。
2024年7月8日,北京大学现代农业研究院在国际顶尖期刊《自然-遗传学》上在线发表了题为Telomere-to-telomere?Citrullus?Super-pangenome Provides Direction for Watermelon Breeding的研究成果,是西瓜科研领域的重大突破。
该研究绘制了西瓜属全部7个种的28份代表性材料的端粒到端粒(T2T)高质量基因组图谱,成功构建属级T2T水平超级泛基因组。得到总计768.5Mb,32,513个基因家族的西瓜属泛基因组,是单个西瓜基因组的1.5倍,增加了11,225个栽培西瓜中没有发现的基因。基于T2T高质量基因组图谱,该研究全面比较了西瓜属的着丝粒序列,其丰富的变异和特有的进化关系影响了不同种之间的杂交配对。因此,该超级泛基因组极大地扩展了西瓜遗传改良的基因池。(图1)
利用基因组序列,该研究拓展了西瓜属的分类系统,核实了西瓜起源于非洲的理论依据,并发现栽培西瓜除之前报道的cordophanus亚种外可能还存在其他祖先。另外,我们在西瓜属内发现了三次重大染色体重排事件和两个超长片段倒位。这些染色体重排显著影响了西瓜的抗性、品质相关基因以及三维基因组结构,并在栽培种中得以保留。同时,这些发现也为回交育种过程中避免连锁累赘提供了基因组基础。(图2)
该超级泛基因组鉴定出西瓜属超过461,987个SV,构建了西瓜图形泛基因组。该研究通过SV-GWAS鉴定了驯化过程中丢失和获得的关键基因,挖掘了与葫芦素含量、含糖量、果肉着色等重要性状相关的功能基因结构变异,发现在西瓜驯化过程中,伴随着多个与甜度增加、果肉变红相关的基因簇扩张,大量抗病功能相关的基因簇丢失。该研究为西瓜育种家提供了较完整的基因组资源,助力深入理解西瓜基因组的复杂性和多样性,从而高效挖掘和利用野生西瓜种中的有利基因。(图3)
最后,该研究利用野生西瓜的基因组序列和抗病基因信息,通过种间杂交选育形成了抗多种病害的自交系‘PKR6’,并有效确定了西瓜抗枯萎病生理小种候选基因。该研究提供了利用野生种质创制优异育种材料的范例,从而将驯化过程中丢失的抗病基因重新有目的地导入栽培种中改良种质,对加速抗病品种选育、促进西瓜产业高效发展具有深远意义。(图4)
西瓜属端到端超级泛基因组是较高质量较全面的西瓜属基因组序列图谱和变异图谱,它揭示了西瓜属的基因组演化历史,发掘了西瓜野生种中丰富的遗传多样性,提供了利用野生种质创制优异育种材料的新范例,为其他作物超级泛基因组的构建和野生种质的利用指明了方向。
内容来源于北京大学现代农业研究院,侵删
]]>文章标题:Assembly of high-quality genomes of the locoweed?Oxytropis ochrocephala?and itsendophyte?Alternaria oxytropis?provides new evidence for their symbiotic rela-tionship and swainsonine biosynthesis
期刊名称:Molecular Ecology Resources
研究物种:黄花棘豆
研究方法:基因组、转录组、重测序、代谢组
百迈客生物为其提供了基因组测序及组装技术服务。
黄花棘豆(Oxyvropis ochrocephala Bunge)隶属于豆科棘豆属,为二倍体(2n=16)多年生植物,是我国草原危害最大的毒害草之一。其能够与内生真菌棘豆链格孢菌Alfernaria oxytropis共生,因该内生真菌合成生物碱苦马豆素(swainsonine,SW)而使植株带有毒性,牲畜误食后导致中毒甚至死亡,对畜牧业发展造成了严重影响。
基因组:黄花棘豆;253.39 Gb Illumina+301.02 Gb Nanopore+330.17Gb Hi-C;棘豆链格孢菌;4.40 Gb Illumina+10.09 Gb Nanopore;
转录组:黄生棘豆无菌幼苗、黄生棘豆及其内生菌共生苗、棘豆链格孢菌;每个材料3个生物学重复;
重测序:从中国3个省13个地理位置采集的黄花棘豆中分离的41株棘豆链格孢菌;19x:代谢组:LC-MS;
代谢组:41株棘豆链格孢菌苦马豆素含量测定
1.黄花棘豆及A.oxytropis基因组组装注释
作者利用三代Nanopore、二代Illumina测序技术以及Hi-C技术测序组装获得一个高质量染色体水平的黄花棘豆基因组:其基因组大小为930.94 Mb,contig N50为1.40 Mb,scaffold N50为121.79 Mb,共注释到31,700个蛋白质编码基因。利用三代Nanopore和二代Illumina测序技术测序组装获得一个高质量的棘豆链格孢菌基因组:其基因组大小为74.48 Mb,contig N50为8.87Mb,共注释到10,657个蛋白质编码基因。
2.黄花棘豆及A.oxytropis基因组进化和全基因组复制分析
黄花棘豆基因组进化分析显示,其大约于42.62百万年前分化出来,且与蒺藜苜蓿、大豆具有较近的亲缘关系。黄花棘豆与蒺藜苜蓿之间基因的共线性关系更好,但染色体发生了部分片段的重排,这些重排的基因主要参与代谢途径。黄花棘豆基因组中6,938个基因家族发生收缩,1,862个基因家族发生扩张,在进化过程中发生了一次WGD事件。A.oxytropis基因组进化分析显示,A.oxytropis与同属的其他真菌聚在一起,与不同属中产苦马豆素的真菌相比,A.oxytropis具有该物种最丰富的特有基因家族,主要与代谢途径相关。基于SW合成基因簇的关键基因swnK的系统进化分析发现,有14个目的真菌均含有该基因簇。基于ITS系统进化分析发现,Altemaria属内产苦马豆素(含有swnK基因)的物种聚在一起,与不含swnK基因的物种分离。
3.黄花棘豆与A.oxytropis基因表达
黄花棘豆与A.oxytropis共生/非共生状态下的转录组分析显示,对寄主而言,其与内生真菌共生后差异基因主要与防御以及次级代谢相关;对内生真菌而言,其在寄主体内共生时,参与脂肪酸代谢、氮代谢以及降解细胞壁相关的差异基因被大量诱导上调表达,同时共生诱导了大量SW合成基因的上调表达。
4.A.oxytropis遗传变异影响苦马豆素含量
该研究丰富了前期推测的SW合成通路,进一步分析显示,一个编码P5CR的基因位于SWN簇上,也包含在SWN的全长序列中。对从中国3个省13个地理位置采集的黄花棘豆种分离的41株A.oxytropis的重测序分析显示,一个位点SNP19996与SW含量相关。
作者构建了高质量黄花棘豆基因组(958.83Mb),及其共生真菌A.oxytropis基因组(74.48Mb,contig N508.87Mb),并对SW生物合成基因进行了细化。41株A.oxytropis的重测序分析找到与SW含量相关位点,转录组分析发现了与宿主的防御和次级代谢相关的差异表达基因(DEGs)。在内生菌中,DEGs与细胞壁降解、脂肪酸和氮代谢有关。共生关系诱导了大部分SW生物合成基因的上调。
]]>文章标题:Chromosome-scale genome assembly clarifies the mechanism of flooding tolerance and evolutionary?history of?Myricaria laxiflora
期刊名称:Industrial Crops & Products
合作单位:西南大学、重庆市林业科学研究院、重庆城市管理职业学院
研究物种:疏花水柏枝
研究方法:基因组学
百迈客生物为该研究提供了基因组测序和部分分析工作。
疏花水柏枝(Myricaria laxiflora),柽柳科,是长江流域天然存在的宝贵植物资源,对淹没的栖息地具有较好的适应性,每年可以忍受大约五个月的淹没。洪水对植物的生长、发育和产量产生负面影响,严重时可能导致死亡。全球气候变化使洪水更加常见和严重。研究疏花水柏枝对极端洪涝环境的适应机制,寻找关键功能基因,为种质改良提供理论和遗传依据。
本研究借助三代PacBio HiFi和Hi-C等技术,构建了高质量染色体水平的疏花水柏枝基因组,最终组装大小为1.34Gb,contig N50=11.69Mb。二代、三代回比比对率分别为94.14%和99.75%,CEGMA和BUSCO评估分别为93.67%和96.47%,表明组装的基因组完整性比较高。结合转录组预测、同源预测和从头预测的方式共得到23,719个蛋白质编码基因。
比较基因组研究发现疏花水柏枝与苦荞(F. tataricum)的亲缘关系最为密切,大约在65-81百万年前(Mya)发生分化;在19.74 ~ 24.60 Mya之间发生了一次全基因组复制(WGD), 4dTV分析证实了这一点。在0.15 Mya左右存在一个长末端重复(LTR)插入。这些基因组变化可能与疏花水柏枝在进化过程中所经历的环境剧变(如青藏高原隆升)有关。基因家族分析显示疏花水柏枝的特有基因家族与能量代谢和信号转导密切相关;85个基因在疏花水柏枝基因组中经历了正选择,这些基因在与氨基酸合成和代谢相关的KEGG通路中显著富集。
作者通过比较水淹和对照条件下疏花水柏枝形态、生理和转录组学的变化,分析了植物对水淹的适应机制。总体而言,在完全淹没的状态下,疏花水柏枝采用“静止”的策略。具体来说,在淹水条件下,光合作用减弱,生长停滞,糖酵解被激活,抗氧化酶系统增强。乙烯反应途径可能是这一过程的调控因子,MlERF-VII基因(Mla11G026380)可能是调控这一过程的关键基因。
本研究成功构建了一个染色体水平的疏花水柏枝基因组,并对其特征进行了分析。进一步结合形态学、生理学和比较转录组学分析评估了该物种适应极端洪水环境(完全淹没)的遗传机制。本研究对疏花水柏枝种质资源的保护和资源的开发利用具有重要意义。
]]>合作单位:中国农业科学院深圳农业基因组研究所
文章标题:Haplotype-resolved chromosome-level genomeof hexaploid Jerusalem artichoke providesinsights into its origin, evolution, and inulinmetabolism
期刊名称:Plant Communications
影响因子:10.5
研究对象:菊芋
测序技术:基因组测序、Hi-C测序
百迈客生物为该研究提供了基因组测序服务。
近日,中国农业科学院深圳农业基因组研究所在植物科学期刊Plant Communications(中科院一区,IF=10.5)上在线发表题为“Haplotype-resolved chromosome-level genome of hexaploid Jerusalem artichoke provides insights into its origin, evolution, and inulin metabolism”的研究论文,构建了六倍体菊芋染色体级别参考基因组, 解析了菊芋基因组起源和演化过程,鉴定了所有菊粉代谢基因拷贝。
菊芋俗称洋姜、鬼子姜,是原产北美、经欧洲传入我国的“舶来品”。菊芋块茎曾作为冬季腌菜在北方百姓餐桌上流行,如今主要用于生产膳食纤维和益生元等保健品或食品添加剂,也可作生物能源植物、青贮饲料。菊芋抗旱、抗寒、耐盐碱、再生能力极强。菊芋基因组推测为同源异源六倍体(2n=6x=102),其基因组庞大且复杂,其种间杂交起源演化假说缺乏细节证据、争议颇多。
本研究利用PacBio HiFi测序、Hi-C染色质构象捕获测序技术,利用自主开发组装算法EndHiC和其他复杂基因组组装中积累的经验和能力,参考同属二倍体向日葵基因组、经过多轮人工校正组装,最终完成了六倍体菊芋的高质量染色体级别组装。参考基因组(去杂合,3x=51)大小为10.5 Gb,含有199,842个蛋白编码基因,基因组大小和基因数目均为向日葵的3倍。
今天的菊芋基因组经历了约4500万年前菊科祖先发生的全基因组三倍化,约2900万年前向日葵超族祖先发生的全基因组加倍,以及约2百万年前菊芋与向日葵分化后发生的全基因组三倍化事件。同源染色体单拷贝直系同源基因的进化分析表明,最近的三倍化是菊芋二倍体与四倍体祖先发生的种间杂交和染色体加倍事件,故菊芋基因组包含了A1, A2、B三个亚基因组。除基因组多倍化事件外,向日葵属内大规模染色体重排、转座子活动、基因突变和人工驯化选择等过程共同塑造了现在的六倍体菊芋基因组。
作为菊粉工业化生产作物,菊芋的菊粉代谢基因(合成酶基因1-SST与1-FFT、分解酶基因1-FEHI与1-FEHII)早已被克隆验证,但每个基因仅克隆了1个拷贝。本研究基于菊芋全基因组序列,系统鉴定了包括已克隆拷贝在内的所有菊粉代谢基因,其中6个1-SST、6个1-FFT、3个1-FEHI和9个1-FEHII参与菊粉代谢,余下的拷贝已变为假基因或丢失功能,菊芋多倍化事件产生的多个菊粉代谢基因仍处在持续进化或功能分化过程中。
文章来源于植物代谢研究
]]>荔枝是一种重要的风味独特的热带水果,具有极高的营养价值和经济价值。荔枝品种按果实成熟期可分为极早熟品种(EEMC)、中早熟品种(EMC)和晚熟品种(LMC)3大类;EEMCs品种稀少,生产价值不高,果实品质较好的品种多属于LMC品种;目前不同成熟期品种间的差异研究较少。荔枝目前在我国的云南、海南和广西、广东等地均有栽培种植,然而,确切的起源中心和荔枝驯化的历史仍然是未知的。研究荔枝基因组的结构和进化对促进荔枝及无患子科近缘植株的遗传改良具重要价值。
基因组:荔枝栽培种“Feizixiao”;~184x Illumina+~58.6x PacBio CLR+~144x Hi-C
重测序:38份野生种和34份栽培种;~13x
1.“Feizixiao”荔枝基因组组装注释
利用三代PacBio、二代illumina测序技术以及Hi-C技术测序,通过优化基因组组装策略,获得高质量的“妃子笑”荔枝基因组染色体水平的组装,主要含15条假染色体序列,大小470Mb,杂合度2.27%,BUSCO评估显示基因组组装完整性为96.2%;同时完成基因组编码基因的结构注释,共注释得到31896个结构基因,注释完整度BUSCO评估94.8%,充分表明所获得的“妃子笑”荔枝基因组质量非常高。荔枝基因密码的破译将为未来荔枝功能基因组研究提供重要的参考。
比较基因组分析表明,荔枝和龙眼-10百万年前(mya)从祖先物种中分离开来,而荔枝所在的无患子科与芸香科大约在67.6mya分离开。荔枝、龙眼、文冠果和甜橙自共享y三倍化事件后并无独立的WGD事件。
2.荔枝的起源与驯化
利用通过对72份荔枝进行重测序分析,发现荔枝大致可分为3个群体,即云南极早熟品种(EEMC/YNW)、海南晚熟品种(LMCHNW)、早熟栽培种(EMC)。其中值得注意的是,大新野生和博白野生荔枝虽然都位于广西,但两者间却存在明显的遗传差异。分析发现云南野生种群经历了强烈的驯化瓶颈。
3.荔枝单倍型注释和扥给基因差异表达
作者通过SNP分型和单细胞10x?Gemomics测序,利用“妃子笑”荔枝的高杂合性(2.27%),成功获得的两个单倍型的基因组(云南单倍型,HY;海南单倍型,HH)。对39个妃子笑”不同组织和时期样本进行转录组测序分析,共鉴定到13517个等位差异表达基因(DEA)。DEA在基因组上的分布并不是均匀的,在某些区域具有集中现象,可能与特定的生物学过程相关。还发现,DEA和等位等量表达基因(EEA)具有相同的Ks值,但是DEA经受更强的选择压力。
4.COL307基因调控果实成熟
为了进一步剖析荔枝果实成熟的调控网络,作者对72个样本进行GWAS分析,20个显著性位点的±50kb内含有109个基因,与正选择基因和开花相关基因取交集,最终筛选到目标基因COL307。COL307下游含有3.7kb序列的缺失,进一步分析发现极早熟果实品种中为纯合缺失,晚熟品种中为纯合不缺失,早熟品种中为杂合缺失,该缺失与果实成熟期高度连锁,可以开发为简便的分子标记用于荔枝辅助育种。
基于荔枝(Litchi chinensis)基因组的高度杂合(~2.27%),构建了两套高质量妃子笑”单倍型基因组(470 Mb)。72份荔枝重测序分析发现,来自云南的一个野生群体的极早熟荔枝品种主要与“妃子笑”的其中一个单倍型对应;来自海南的一个野生群体的晚熟荔枝品种则与另外一个单倍型对应。早熟荔枝品种可能是极早熟荔枝品种与晚熟荔枝品种的杂交形成的,在广东培育而成。包含一对CO-likc基因的3.7kb序列的缺失变异可能调控着不同荔枝品种间的果实成熟差异。
期刊名称:The Plant Journal
合作单位:中国医学科学院/北京协和医学院药
研究物种:夏枯草
百迈客提供:基因组测序和部分数据分析服务
2024年1月16日,The Plant?Journal上线了一篇关于夏枯草基因组的研究论文,“Chromosome-level genome assembly of?Prunella vulgaris?L. provides insights into pentacyclic triterpenoid biosynthesis”,报道了组装到染色体水平的夏枯草基因组,为进一步阐明五环三萜的生物合成机制奠定了基础。
夏枯草(Prunella vulgaris)是最畅销、应用最广泛的中草药之一。据中国药典记载,它是一种清洁和保护肝脏的良药,几百年来一直被许多凉茶用作配方的主要成分。它也是欧洲和其他亚洲国家的一种传统民间药物。五环三萜是夏枯草产生的一类重要的生物活性化合物,而它们的生物合成机制仍有待阐明。本研究使用Illumina,ONT和Hi-C技术相结合的方法,获得了夏枯草的染色体水平参考基因组。其大小为671.95Mb,scaffold N50为49.10Mb,完整的BUSCO达到了98.45%。约98.31%的序列被锚定到14条假染色体上。比较基因组分析揭示了夏枯草中最近的全基因组复制(WGD)事件。全基因组分析鉴定出35932个蛋白编码基因(PCGs),其中59个编码了参与生物合成2,3-氧化鲨烯的酶。此外,还鉴定了10个PvOSC、358个PvCYP和177个PvUGT基因,其中5个PvOSCs、25个PvCYPs和9个PvUGTs被预测参与了五环三萜的生物合成。PvOSC2、PvOSC4和PvOSC6重组蛋白的生化活性测定表明,它们分别是混合香树脂醇合酶(MAS)、羽扇豆醇合酶(LUS)和β-香树脂醇合酶(BAS)。这些结果为进一步阐明夏枯草中五环三萜的生物合成机制提供了坚实的基础。
Prunella vulgaris(图1a,b)是一种唇形科的多年生草本植物。它在中文里被命名为“夏枯草”,表明它通常在夏天枯萎。由于其在伤口愈合上的用途,P. vulgaris也被称为“self-heal”。在《中国药典》中,夏枯草的刺被记载为药用部位,并被推荐为清洁和保护肝脏的良药,特别是用于治疗肝火症状,如眼睛夜间疼痛、头晕、喉咙痛、退热。由于夏枯草具有抗微生物、抗炎症、免疫调节、抗氧化、抗肿瘤、抗高血压等多种生物活性,因此它在许多其他亚洲国家和一些欧洲国家也被用作传统民间药物。此外,在许多凉茶配方中,夏枯草也是主要成分之一。在中国,特别是在中国南方,当地人相信含有夏枯草的凉茶具有降肝火、保护肝脏免受癌症和炎症、保护呼吸系统免受喉咙痛的特性。到目前为止,夏枯草已成为中国最畅销和广泛使用的草药之一。
五环三萜及其皂苷是夏枯草中一类重要的生物活性成分,与夏枯草的抗癌和抗炎特性有关。三萜类化合物是植物中最大的次生代谢产物类别之一。根据骨架可分为无环三萜、双环三萜、三环三萜、四环三萜、五环三萜、六环三萜等亚类。三萜的生物合成从MVA途径的乙酰辅酶A和MEP途径的丙酮酸与甘油醛-3-磷酸开始。MVA途径主要作用于细胞质,在细菌、古菌与真核生物中都是保守的;而MEP途径作用于质体,主要存在于真细菌和植物中。这两种途径都导致通用C5异戊二烯单元的生物合成。它们会聚在异戊烯二磷酸(IPP)和烯丙基二磷酸(DMAPP)上。经法尼基二磷酸合酶(FPPS)、角鲨烯合成酶(SQS)和角鲨烯环氧化酶(SQE)的连续催化,IPP和DMAPP转化为三萜和甾体生物合成的关键中间体2,3-氧化角鲨烯。随后,氧化角鲨烯环化酶(OSCs)通过椅-船-椅(C-B-C)构象催化中间体环化,生成达原甾醇阳离子,用于类固醇和大多数四环三萜的生物合成,或通过椅-椅-椅(C-C-C)构象生成达玛烯基阳离子,用于生成五环三萜骨架。在植物中,循环产物的进一步修饰包括主要在细胞色素P450单加氧酶(CYPs)催化下的氧化和主要在尿苷二磷酸-糖基转移酶(UGTs)催化下的糖基化。
OSCs是由一个基因家族编码的一组环化酶,可催化2,3-氧化角鲨烯环化成结构多样的甾醇和三萜骨架。在植物甾醇(如羊毛甾醇和环阿屯醇)的生物合成过程中,OSCs通过CBC构象催化2,3-氧化角鲨烯的环化。参与这些过程的OSCs分别被称为羊毛甾醇合酶(LAS)和环阿屯醇合酶(CAS)。在五环三萜的生物合成过程中,OSCs通过CCC构象催化2,3-氧化角鲨烯的环化,根据其产物可分为混合-香树脂醇合酶(MAS)、羽扇豆醇合酶(LUS)、β-香树脂醇合酶(BAS)和DS。
CYP超家族是植物中最大的基因超家族之一。根据CYP系统发育树的分支,植物CYP蛋白可分为11个氏族和127个家族。有七个氏族是单家族,包括CYP51、CYP74、CYP97、CYP710、CYP711、CYP727、CYP746,而其余的CYP71、CYP72、CYP85、CYP86氏族为多家族。在生成骨架后,在五环三萜的C-2、C-3、C-16、C-19、C-22、C-23、C-24、C-28等不同位点进行氧化和糖基化修饰,生成大量的三萜。氧化修饰主要涉及CYP716家族成员。此外,CYP51、CYP71、CYP72、CYP85、CYP87、CYP88和CYP93家族的一些成员也可能参与。
以尿苷二磷酸糖作为糖基供体的可能性命名的UGTs,在已发现的106个糖基转移酶家族中属于第1家族。根据UGTs的3D结构状态,将其分为GT-A、GT-B、GT-C和GT-D四种类型。植物UGTs属于GT-B,它在开花植物中可进一步分为18个类群(A-R)和一个外类群。五环三萜的糖基化通常发生在C-3、C-23和C-28位点,主要涉及UGT73家族成员和UGT71、UGT74、UGT85、UGT91和UGT94家族的部分成员。虽然C-19羟基化的五环三萜类化合物,如苦委陵菜酸(TA)、坡模酸(PA)及其皂苷广泛存在于植物中,但迄今为止,负责C-19羟基化的氧化酶尚未被发现。
虽然夏枯草具有很高的药用价值,但与农作物、模式植物以及丹参、人参和罂粟等多种药用植物相比,对其研究较少。关于其生物活性成分及其生物合成机制的报道很少。为了促进对夏枯草的研究,我们采用Illumina、ONT和Hi-C技术相结合的方法对其基因组进行了测序,并将序列组装到染色体水平,然后进行比较分析。参与五环三萜生物合成的基因在全基因组范围内被鉴定出来,并揭示了三种PvOSCs的功能。这些结果为进一步分析提供了夏枯草属的第一个染色体水平的基因组。
参考文献:Zhang, S., Meng, F., Pan, X., Qiu, X., Li, C. and Lu, S. (2024), Chromosome-level genome assembly of?Prunella vulgaris?L. provides insights into pentacyclic triterpenoid biosynthesis.?Plant Journal. https://doi.org/10.1111/tpj.16629
文章来源于植物代谢研究
]]>
豇豆(Vigna unguiculata L. Walp., 2n = 2x = 22)起源于非洲,在世界范围内作为粮食、蔬菜或牲畜饲料种植。驯化豇豆已形成两个主要栽培亚种:非洲的粮用豇豆和亚洲的菜用豇豆。这两个亚种在许多重要的农艺性状上差异很大,如荚长(PL)、单荚粒数(GNP)和营养品质等。
之前的研究已经报道了一些控制豇豆驯化与改良性状的QTLs,如裂荚性(PS)、PL、荚果品质和种子大小等。然而,与亚种驯化相关的全基因组选择特征尚不清楚。尽管高质量的粮用豇豆基因组已经发布,但由于高质量菜用豇豆基因组信息的缺乏,阐明不同豇豆亚种驯化和改良的遗传机制仍存在严重的阻碍。因此,全面解析豇豆基因组可以为不同亚种的驯化与改良提供见解,并为其育种改良提供重要的基因组资源。
Denovo:
菜用豇豆G98,Illumina:107.99x;PacBio HiFi:49.36x;Hi-C:73.88Gb
粮用豇豆G323,Illumina,121.57x;PacBio HiFi:41.82x;Hi-C:68.64Gb
重测序:
344份全世界收集的豇豆核心种质,其中包括342份栽培豇豆(87份粮用豇豆、244份菜用豇豆和11份未知用途豇豆)和2份野生豇豆;Illumina测序,10x深度
基因单倍型验证:
菜用豇豆地方品种 ‘ZN016’ 和菜用豇豆育成品种‘Zhijiang282构建的RIL群体(183 lines)
G98和G323构建的F2群体(165 individuals)
该研究选择了长荚菜用豇豆(G98)和抗病性强的粮用豇豆(G323)进行基因组Denovo。K-mer预估G98和G323的基因组大小分别为623.16Mb和597.42Mb,最终组装的基因组大小分别为568.24Mb(scaffold N50 = 49.41Mb)和552.66Mb(scaffold N50 = 49.35Mb)。二代回比率(G98:99.19%;G323:99.69%)、CEGMA(98%)、BUSCO(95%)和Merquery(G98:44.48;G323:47.17)评估表明本次构建了2个高质量的染色体水平豇豆基因组。
G98和G323分别预测到33,159和33,222个蛋白编码基因,重复序列占基因组的56.97%(G98)和55.25%(G323),以Gypsy的长末端重复反转录转座子(LTRs)为主,分别占基因组的17.19%(G98)和18.72(G323)。
对25个物种进行系统进化树分析显示豇豆与赤小豆(V. angularis)和绿豆(V. radiata)亲缘关系较近,它们的分化时间大约在6-27百万年前(图2a),这与之前的报道一致。基因家族分析发现G98中有512个家族发生了显著扩张,这些扩张的基因家族在参与膜组织的鞘糖脂代谢途径显著富集,可能与菜用豇豆的豆荚发育相关。相反,G323扩张基因在氨基酸糖和核苷酸糖代谢、硫代葡萄糖苷-谷氨酰水解酶和半乳糖代谢等能量产生和转化途径中显著富集(图2b, c),这可能与粮用豇豆更高的碳水化合物积累和防御反应有关。
作者以G323为参考基因组,对2个基因组进行变异检测,在G98上共发现2,219,947个SNPs,其中38,420个SNPs可能引起基因功能的改变;发现407,119个InDels,其中62.50%的可能引起蛋白编码的改变;另外,发现13,541个SVs(包括963个TRANS,74个INVS,3,701个DUPs,7,112个PAVs和1,691个CNVs)。
值得注意的是,作者发现了5个较大的SV区域(> Mb)(图2d, f)。Chr1包含一个7.5 Mb的INV和多个相邻的TRANS,分别包含61个和31个基因(图2d)。Chr6包含一个4.73 Mb的INV区和一个5.14 Mb的INV区,包含两个INVs,两个DUPs和两个TRANS。这两个区域分别包含42和52个基因(图2e)。Chr10含有最大的一个INV,共包含224个基因(图2f)。在其余染色体上共检测到13个其它SV区域。
作者进一步对全世界收集的344份豇豆核心种质进行重测序,PCA分析将其划分为2个聚类(图3a),主要由粮用豇豆(cluster I)和菜用豇豆(cluster II)组成。利用菜豆作为外群,系统发育树将其划分为以粮用豇豆(G)、菜用豇豆地方品种(VL)和菜用豇豆育成品种(VC)为中心的3个类群(图3b)。群体结构分析也支持了PCA和系统发育树的结果(图3b)。
对三个亚群的核苷酸多样性(π)和群体差异(Fst)进行分析(图3c)。G组(π = 0.0007)核苷酸多样性显著高于VL组(π = 0.00047)和VC组(π = 0.00024)。G-VC(0.1903)和G- VL(0.0924)的FST值均高于VC-VL(0.0498)。此外,与VL和VC组相比,该组的连锁不平衡衰减更快,表明粮用豇豆的遗传重组程度更高(图3d)。
为了研究自然或人工选择对豇豆分化的影响,作者通过选择清除分析比较了三个豇豆亚群之间的基因组选择特征,鉴定出239个与豇豆驯化和改良相关的基因。
进一步结合GWAS分析,共鉴定出与嫩荚总淀粉含量(PTS)、籽粒总淀粉含量(STS)、单荚籽粒数(GNP)、嫩荚可溶性糖含量(PSS)和荚长(PL)相关的18个受选择的区域。裂荚性(PS)是最显著的驯化性状之一,在SNP-GWAS和InDel-GWAS中均监测到相关位点。其中一个PS位点(PS-3.2)在344份材料中存在2个单倍型,Hapll材料的裂荚率更高(48%)(图4b);另外3个PS位点(PS-3.3, PS-4.2, PS-10.3)的不同单倍型之间的裂荚率差异很小。在G和VL的驯化扫描中发现了6个PS相关位点 (图4a),解释了这两个亚种之间PS抗性的差异。基因表达分析发现,大多数裂荚相关候选基因在G型豇豆和V型豇豆荚间的表达模式不同,表明基因的表达可能与PS呈正相关。该发现将为提高豇豆耐裂荚性提供理论基础。
产量相关基因和品质相关基因在3个亚群体(G、VL和VC)中的多态性和分布揭示了豇豆表型分化的遗传基础。荚长(PL)、单荚粒数(GNP)和千粒重(TSW)是影响豇豆产量的重要因素,G亚群的PL通常比VL和VC亚群的PL短得多(图5a)。GWAS分析挖掘到与这3个性状相关的位点和候选基因,并对候选基因单倍型及其表达分析,发现PL差异可能是由于VuPL1-HapII 和 VuPL4-HapI (图5b) 在豇豆驯化和改良过程中强烈选择引起的。在重组自交系(RIL)群体中进一步验证了VuPL1和VuPL4的功能,发现VuPL1似乎比VuPL4在该群体中具有更强的作用。同时基因表达分析发现WAKs基因可能以剂量/转录依赖的方式导致PL差异。粮用豇豆的GNP也通常比菜用豇豆的低,可能是VuGNP2-HapIII这一有利单倍型引起的(图5e)。TSW则可能与VuTSW1和VuTSW2基因的有利单倍型有关(图5f),其功能也分别在RIL群体和F2群体中得到进一步验证。
可溶性糖、总淀粉和粗蛋白质含量是豆科作物的三个基本品质性状。GWAS分析检测到三个信号与嫩荚可溶性糖含量(PSS)显著相关(图6a),其中VuPSS1可能是功能相关基因,VuPSS2可能通过其顺式调控元件影响PSS含量,VuPSS3-HapIV单倍型是PSS的有利单倍型。嫩荚粗蛋白含量(PCP)差异可能与有利单倍型VuPCP1-HapII和VuPCP2-HapI有关。籽粒可溶性糖(SSS)含量相关的信号(图6e)包含一个FAR1-related SEQUENCE (FAR1)家族蛋白(VuSSS1),FAR1在淀粉合成以及糖的运输和降解中起作用,VuSSS1-HapI为其有利单倍型(图6f)。VuSCP2-HapIII和VuSCP2-HapIV通常导致更高的籽粒粗蛋白含量(SCP),VuSCP1和VuSCP2相似的表达模式提示它们可能影响种子发育中期的SCP表型。籽粒总淀粉含量(STS)GWAS分析检测到5个相关信号(图6i),STS-2.1中的VuSTS2含有一个MYB转录因子,STS-11.1中的VuSTS5编码一个磷脂酰丝氨酸脱羧酶,该酶可能影响植物发育的关键调节因子磷脂酰丝氨酸。两种基因的不同单倍型在两种环境中表现出不同的STSs,这表明它们在很大程度上受环境条件的影响(图6j)。STS-3.1中的VuSTS3编码了一个未知的蛋白,其中VuSTS3-HapIII对STS的影响最大。STS-6.1含有一个NAD依赖性蛋白去乙酰化酶VuSTS4,可能影响淀粉的生物合成和调控,而VuSTS4-HapI对STS的作用更强。以上结果有潜力成为粮用豇豆和菜用豇豆产量和品质改善的遗传资源。
本研究结合PacBio、Hi-C和二代测序,组装了粮用豇豆和菜用豇豆的染色体水平基因组。对包括地方品种、野生品种和育成品种的344个材料进行二代测序,以阐明豇豆基因组的系统进化。此外,还进行了全基因组关联分析(GWAS),确定关键产量和品质性状相关基因。该研究揭示了两个亚种之间基因组结构变异(SVs)的全图谱,为豇豆在全基因组选择下的驯化与改良提供了见解。产量性状和品质性状的差异基因组选择将有助于建立粮用豇豆和菜用豇豆双向改良的遗传资源。
参考文献:Wu, X., Hu, Z., Zhang, Y. et al. Differential selection of yield and quality traits has shaped genomic signatures of cowpea domestication and improvement. Nat Genet (2024).