木姜叶柯中根皮苷和三叶苷生物合成途径相关基因的鉴定及研究

木姜叶柯[Lithocarpus litseifolius(Hance)Chun]为壳斗科柯属常绿乔木,主要分布在中国长江以南的山区,印度、泰国也有所分布,其嫩叶可被直接煎煮做成茶汤,长期服用有养生保健功效。木姜叶柯中主要成分为类黄酮和三萜类,根皮苷和三叶苷属于二氢查尔酮类化合物,是木姜叶柯中的主要的活性成分,具有降血糖、降血脂、抗炎和抗肿瘤的生物活性。除此以外,三叶苷还是一种健康的天然甜味剂,其甜度是蔗糖的300倍。但是天然生长的木姜叶柯植株分散,且树形高大,采摘叶片困难,费时费力,不利于有效成分的提取。随着合成生物学技术的发展,基于根皮苷和三叶苷生物合成途径中高效关键酶基因的发现,构建细胞工厂实现相关化合物的异源生产成为一种新的可持续的生产方式。目前,苹果中根皮苷和三叶苷生物合成途径已基本被阐明,多个可以催化根皮素糖苷化的糖基转移酶已经被鉴定,但多存在催化活性低、专一性弱的问题。所以进一步从植物中鉴定催化活性更高、专一性更强的糖基转移酶,是提高根皮苷和三叶苷生物合成产量的重要前提。木姜叶柯中根皮苷和三叶苷的含量丰富,然而目前该植物中尚未有参与根皮苷和三叶苷生物合成途径基因的报道。基于此,本课题对木姜叶柯进行了高通量全长转录组的测序。深入开展了木姜叶柯中根皮苷和三叶苷生物合成途径中关键酶基因的克隆和功能研究,以期发现能够高效催化根皮苷和三叶苷形成的关键酶。主要研究内容如下:1.木姜叶柯不同组织部位根皮苷和三叶苷的含量测定使用UPLC-Q-TOF-MS对木姜叶柯嫩叶、老叶、嫩茎、老茎、根及根茎混合物当中的根皮苷和三叶苷含量进行定量。实验结果表明,根皮苷在木姜叶柯不同组织部位的含量由高到低分别为老叶、嫩茎、根茎混合物、老茎、嫩叶和根,而三叶苷仅在叶中积累,且嫩叶中的积累量是老叶的两倍之多。木姜叶柯中根皮苷和三叶苷的积累为根皮苷和三叶苷合成途径基因的筛选提供了稳定可靠的实验材料,其积累规律为制定转录组测序策略提供了参考。2.木姜叶柯不同组织部位的转录组测序及基因注释结果基于化合物含量检测的结果,采用高通量测序技术对木姜叶柯的根、茎、老叶和嫩叶进行了转录组测序,原始数据经过组装、拼接、去冗余后,共得到34,215个Unigene。比对到NR、Swiss Prot、KEGG、KOG、GO、NT、Pfam等数据库中共注释得到33,669个基因。根据注释信息,从转录组中共筛选到3条PAL基因、15条4CL基因、35条DBR基因、2条CHS基因以及135条UGT基因参与根皮苷和三叶苷生物合成的关键酶基因,为后续基因的全长克隆寻找更多提供了基础。3.双键还原酶的克隆及生物信息学分析从转录组中筛选到12条候选双键还原酶基因,分别命名为Ll DBR1~Ll DBR12。设计特异性扩增引物,通过PCR技术克隆到12条全长序列。构建p ET28a-HIS-MBP原核表达载体,进行测序分析后获得14条DBR基因序列,其中Ll DBR9测序获得了4条基因序列,Ll DBR11测序获得了2条基因序列。对14条序列进行了生物信息学分析,Ll DBR1~Ll DBR12的ORF区长度在1000~1070 bp之间,编码氨基酸数量在340~360之间。亚细胞定位显示,14个蛋白主要定位在细胞质。多序列比对分析结果表明,14个蛋白均具有保守的GXXS区域和甘氨酸富集区域(AXXGXXG或GXXGXXG)。系统发育树表明,14个蛋白均与已报道功能的蛋白聚在一起,且序列一致性较高。为后期基因的功能鉴定提供了理论依据。4.糖基转移酶的克隆、功能验证和生化特性分析从转录组中筛选到24条候选糖基转移酶基因,分别命名为Ll UGT1~Ll UGT24。设计特异性引物,利用PCR技术克隆得到了20条全长序列。构建p ET28a-HIS-MBP原核表达载体,最终得到21条候选UGT基因,其中Ll UGT9测序获得了3条基因序列。异源表达及体外酶促反应表明,Ll UGT4、Ll UGT7、Ll UGT8、Ll UGT9-1、Ll UGT9-2、Ll UGT9-3、Ll UGT15均能催化根皮素生成糖苷化产物。对这7个蛋白进行了相应的生物信息学分析,选择可以在体外高效催化根皮素生成根皮苷和三叶苷的Ll UGT8和Ll UGT9-3进行酶促反应动力学分析(载体更换为p ET28a)。结果表明,Ll UGT8最佳反应时间为8 h,最适温度在50℃,最佳p H值为8.8的Na_2CO_3-Na HCO_3缓冲体系。Ll UGT9-3最佳反应时间为8 h,最适温度为40℃,最佳p H值为8.8的Na_2CO_3-Na HCO_3缓冲体系。Ll UGT8的k_m值47.54μM,k_(cat)为0.02 s~(-1),k_(cat)·k_m~(-1)为365.97 mol~(-1)·s~(-1)。Ll UGT9-3的k_m值79.92μM,k_(cat)为0.04 s~(-1),k_(cat)·k_m~(-1)为441.06 mol~(-1)·s~(-1)。底物谱筛选结果表明,Ll UGT8以UDP-Glc为糖基供体,可以催化6种不同结构类型的黄酮类化合物发生糖基化反应,而Ll UGT9-3以UDP-Glc为糖基供体,可以催化15种不同结构类型的黄酮prognosis biomarker类化合物发生糖基化反应,这表明Ll UGT9-3比Ll UGT8具有更高的底物杂泛性。糖基转移酶生化特性的全面解析为酶的改造提供了理论基础,也为后续在木姜叶柯植物体内的功能研究奠定了基础。本研究基于木姜叶柯转录组数据分析,克隆了可能参与根皮苷和三叶苷生物合成途径的12条DBR基因和24条UGT基因。体外酶促反应发现了7条可以催化根皮素糖基化的糖基转移酶,其中2条可以在体外更多高效催化根皮素生成根皮苷和三叶苷。同时也对这两个糖基转移酶进行了深入的生化特性研究。本研究为实现根皮苷和三叶苷的合成生物学生产奠定了基础。