结直肠癌相关功能性单核苷酸多态性的鉴定及调控机制研究

结直肠癌(Colorectal cancer,CRC)是导致人类死亡的主要癌症,提高结直肠癌的预防和治疗水平是人类面临的主要挑战之一。结直肠癌是一类由风险基因突变与环境因素共同导致的复杂疾病。风险基因的变异会导致细胞的增殖、凋亡等生理过程受到影响,进而发展成恶性肿瘤。APC、SMAD4、LKB1等风险基因的突变及多态性仅能解释2%–5%结直肠癌病例,因此探究结直肠癌风险基因的突变及多态性对疾病的预防及精准治疗具有重要意义。基因多态性中最常见的是单核苷酸多态性(Single Nucleotide Polymorphisselleckchem Bafilomycin A1m,SNP)。全基因关联研究(Genome-wide association study,GWAS)将全基因组中的SNP作为主要的遗传标记,通过统计关联分析的方法,得到与表型相关的、影响疾病发展的SNP。目前GWAS已经确定了160多个结直肠癌风险位点,鉴定了大量与疾病相关的SNP及易感基因,然而尚存在以下问题:第一,GWAS发现90%的SNP位于基因的非编码区,且有时同一风险位点的SNP多达上千个;第二,GWAS只是理论上预测与疾病相关的SNP及风险基因,而潜在的分子机制、SNP与基因表型的关系仍不得而知;第三,缺乏有效的实验方Trickling biofilter法来筛选及验证功能性的SNP。为了高通量筛选位于非编码区的结直肠癌相关的功能性SNP,揭示功能性SNP的作用机制,本课题开展了以下研究:(1)引入Regulatory element screening(Reel-seq)筛选技术,高通量筛选结直肠癌相关的功能性SNP并进行鉴定。(2)利用特异性竞争性结合蛋白鉴定(Specific DNA Competitor Pulldown-Mass Spectrometry,SDCP-MS)技术、等位基因不平衡结合(Allele Imbalanced DNA Pull Down Western Blots,AIDP-WB)技术,揭示并验证结合在功能性SNP上的调控蛋白。(3)采用si RNA干扰等技术,进一步探究结合蛋白对基因的调控机制。本课题根据GWAS Catalog数据库,构建并合成了6,161个结直肠癌相关的SNP文库,包含13,781个结直肠癌相关的SNP序列,经过筛选、测序分析后得到349个候选功能性SNP。选取SMAD7(rs12953717、rs7227023)、ATF1(rs10876090、rs10876097、rs12424860、rs1344958、rs4768921、rs73096846)、CDH1(rs12443730、rs35648619)基因座上10个SNP进行凝胶阻滞迁移电泳实验(Electrophoretic mobility shift assay,EMSA)和双荧光素酶报告基因双重验证,确定了这10个SNP为功能性SNP。紧接着以SMAD7为重点进行深入研究。以筛选得到的SNP为中心,扩大到连锁不平衡R~2大于0.8的所有SNP(rs7229639、rs4991143、rs4939826、rs34007497、rs58920878、rs8085824),通过报告基因、EMSA及竞争性EMSA等实验证明了SMAD7基因座上的上述8个连锁的SNP为功能性SNP。在此基础上,利用SDCP-MS技术,共鉴定了23个与其中4个功能性SNP rs7227023、rs58920878、rs8085824、rs12953717结合的蛋白。通过AIDP-WB实验确定了调控蛋白HNRNPK与rs8085824-C,THOC6与rs7227023-C/A,DDX21与rs58920878-C,H1-3与rs12953717-T特异性结合。利用si RNA敲低调控蛋白HNRNPK、DDX21、THOC6、H1-3的表达,在DLD1、HCT116、HT29、SW480结直肠癌细胞系中证明了这些调控蛋白对SMAD7的调控作用。以HNRNPK为例,通过报告基因、过表达及CRISPR-cas9敲除等方法证实了rs8085824为调控SMAD7表达的功能性位点,HNRNPK作为转录调控因子,可通过结合rs8085824-C对SMAD7进行调控。HNRNPK对SMAD7的调控作用会影响结直肠癌细胞的功能:敲低HNRNPK的表达,SMAD7表达下调,结直肠癌细胞系DLD1的增殖受到抑制,细胞克隆数形成减少,细胞凋亡比例上升,当恢复SMAD7的表达,细胞的增殖、克隆数形成得到恢复。这就表明HNRNPK可以通过rs8085824-C调控SMAD7的表达影响结直肠癌细胞的增殖。综上可推断功能性SNP与调控蛋白结合的改变会影响SMAD7的表达,进而影响结直肠癌的进程。最后,本课题也揭示了SMAD7基因座上其他4个功能性SNdiABZI STING agonist溶解度P(rs7229639、rs4991143、rs4939826、rs34007497)上结合的蛋白,结合数据库,以SMAD7为中心建立了SNP特异的调控网络,并对c-MYC-HNRNPA1、HNRNPA2B1、PTBP1-SMAD7网络轴进行了验证,证明了上游原癌基因c-MYC可以通过结合蛋白HNRNPA1、HNRNPA2B1、PTBP1调控SMAD7的表达。这可能是c-MYC影响结直肠癌易感性的另一条途径。综上,本课题以高通量的Reel-seq筛选方法成功筛选到了结直肠癌相关的多个功能性SNP,同时揭示了结合在功能性SNP上的调控蛋白对于SMAD7基因的重要调控作用。最后破译了SMAD7基因座上所有功能性SNP的调控蛋白,并建立了结直肠癌SNP特异性的SMAD7调控网络,实现了将结直肠癌GWAS数据信息转化成具体的生物功能,为结直肠癌的早期筛查及后期精准治疗提供了更多的理论依据及靶向选择。