1. 首次组装了两个陆、海新品种高质量基因组。该研究率先组装了我国自育陆地棉现代品种农大棉8号(NDM8)(优质高产多抗,2010-2017年6次进入全国大田作物授权品种面积前十排行榜)和海岛棉新品系Pima90(抗病优质,长期用于棉花抗病遗传、QTL定位和基因克隆及分子育种)的基因组。基因组重要质量参数:大小分别为2.29Gb和2.21Gb,ContigN50为13.15Mb和9.24Mb,基因组锚定率为99.57%和99.75%,gap比率为0.003%和0.06%。鉴定陆地棉NDM8基因80,124个,其中1,499个为预测的新基因;海岛棉Pima90基因79,613个,其中1,267个为预测的新基因。98%以上的基因都能被多样化转录组数据支持。分析还发现,Copia和Gypsy转座子对农艺性状的分化起着重要作用。
2. 破译了海岛棉、陆地棉结构变异图谱。为了在陆地棉现代育种中潜在有效地利用海岛棉基因组变异,将Pima90基因组与NDM8基因组比对分析,发现海岛棉存在高度的基因组多样性,插入和缺失在D亚组上的密度明显高于A亚组,31,296个变异-基因对在海岛棉组织中显著特异表达,5,815个插入缺失位于5,256个基因的外显子区,其中3,178个变异与转录产物一致。发现Pima90中编码蔗糖合酶的基因GbM_D13G2394 存在2bp的缺失,该基因在纤维伸长期和次生壁加厚期的高表达,表明对海岛棉纤维长度和强度有重要作用。追踪利用Pima90和CCRI8海陆回交育成的新材料NDM373-9的基因组序列,发现该材料获得了来自于海岛棉的171个外显子区结构变异,其中有34个和12个基因分别与已报道的抗病性和纤维发育有关。
为了探明陆地棉现代品种的基因组变化,将NDM8基因组和TM-1(Wang, M. J. et al.2019)进行比较,发现NDM8存在76,568个结构变异,其中28,626个结构变异能够在10~1081个重测序种质材料中检测到。插入和缺失在D亚组上的密度明显高于A亚组,而且在端粒附近具有偏好性,是染色体其它区域的3.71倍。发现603个插入缺失位于526个基因的外显子区,同源基因中编码肉桂酰辅酶A还原酶的基因GhM_A02G1731 在TM-1中存在1个缺失(剪切位点),导致该基因转录后的NAD结构域受损,影响了基因的抗病性功能。研究还揭示了现代育种的选择效应,现代品种较早期品种获得了1,128个NDM8基因组结构变异。
3. 揭示了棉花重要性状结构变异和基因。为探明基因组结构变异对重要性状的遗传效应,以现代品种NDM8为参考基因组,对1,081份世界各地的陆地棉种质资源重测序(平均10.65×)获得的304,630个结构变异,以及大规模多环境(9-15个)评价获得的纤维长度、强度、铃重、衣分和黄萎病抗性数据分析,发现446个与重要性状显著关联结构变异。在Dt11染色体的1个370kb区域内,有69个和56个NDM8型结构变异能够分别显著增加0.71~0.99mm和1.00~1.19mm的纤维长度,使得长度从27mm或者28mm级别增至29mm级别(纤维长度增加1mm,每吨皮棉售价一般可增加300元左右);在Dt03染色体上的2个变异能够分别使衣分从37.49%增至39.69%、37.47%增至40.00%;在Dt11的69.00~69.33 Mb区段内的3个变异能够使黄萎病病情指数(DI)降低13.6,可使棉花抗性反应型从感病(DI=44.5~45.2) 变为耐病(DI=30.9~31.1)。研究发现,品质性状的变异主要位于D亚组,而产量性状的主要位于A亚组;在907个与纤维品质、产量相关的基因中,84.23%的基因在纤维不同发育时期表达。编码S-去甲乌药碱合成酶基因GhNCS,在抗黄萎病品种中的表达量显著低于感病品种,沉默该基因导致抗病性显著增强,使NDM8由耐病变为抗病,CCRI8从感病变为耐病,然而拟南芥中过量表达该基因表现为更感病,表明GhNCS是控制黄萎病抗性的一个重要新基因。