摘要
CCCH型锌指蛋白是锌指蛋白中的一大类,它包含一个或多个由三个半胱氨酸和一个组氨酸组成的,能与锌离子结合的基序。相比较而言,动物中CCCH蛋白研究的比较多,对其功能的了解也比较透彻,而植物中CCCH蛋白研究非常之少。迄今为止,对植物CCCH蛋白的研究只是局限于个别基因的鉴定与功能分析,没有任何研究从基因组水平对此基因家族进行分析。 本研究中用两种方法检索了模式植物拟南芥和水稻的基因组,获得编码含有CCCH锌指的基因。一是以已知CCCH基因的序列作为检索条件,利用BLAST查找其同源序列。二是根据CCCH锌指结构的保守氨基酸序列编写正则表达式,用Perl语言操纵含有基因组数据的本地Mysql数据库。这两种方法得到的结果经过数据处理之后,再用SMART或者Pfam检测序列中的CCCH基序,最后从拟南芥和水稻基因组中分别鉴定到68个和67个CCCH基因。我们做了基因家族的分类、染色体的定位、组织表达模式分析、锌指立体结构预测等方面的研究。主要研究结果如下: 1.利用BLAST同源检索和Perl语言编写的程序分别从模式植物拟南芥和水稻中鉴定到68个和67个CCCH基因。 2.用neighbor-joining法分别构建拟南芥和水稻中CCCH基因家族的系统发生树,根据分支上的解靴带值将其分成若干亚家族。将拟南芥的CCCH家族分为11个亚家族,用罗马字母命名为Ⅰ到Ⅺ,将水稻的CCCH家族分为8个亚家族,命名为Ⅰ到Ⅷ。从系统发生树上可以看出,CCCH基因家族是锌指蛋白的一个大的分类,亚家族才是有共同特征的基因家族。 3.利用网络资源分别将拟南芥和水稻中的CCCH基因在染色体上进行了定位。通过对复制区域的CCCH基因的分析发现,基因组加倍事件对CCCH基因家族的形成有重大影响。 4.用相同的方法在苔藓植物、裸子植物和被子植物的EST数据库中分别鉴定到CCCH基因的存在。 5.对135个CCCH蛋白中302个CCCH基序的序列比对发现,拟南芥中共有42个成员含有C-X7-C-X5-C-X3-H,44个成员含有C-X8-C-X5-C-X3-H;水稻中共有35个成员含有C-X7-C-X5-C-X3-H,36个成员含有C-X8-C-X5-C-X3-H。75%以上的CCCH基序含有甘氨酸和苯丙氨酸残基。通过序列分析给出了CCCH基因的新定义:CCCH基因编码的蛋白包含1到6个CCCH类型的锌指基序,其基序的特征是富含甘氨酸和苯丙氨酸残基的C-X4-15-C-X4-6-C-X3-H。 6.利用MPSS和EST的公共数据库资源统计了拟南芥和水稻中CCCH基因的组织表达模式。根据表达模式的差异可以将CCCH基因分为三类,第一类的基因在所有四种检测的组织有都有表达,这类基因在拟南芥中有33个,在水稻中有36个;第二类包括拟南芥中的18个基因和水稻中的12个基因,这些基因只是在部分组织而不是在全部组织中表达;第三类的基因是组织特异表达的基因,包括17个CCCH基因。 7.对拟南芥亚家族Ⅸ和水稻亚家族Ⅰ中20个基因进行了详细的分析。序列分析表明它们都含有C-X5-C-X4-C-X3-H基序和保守的CHCH(C-X5-H-X4-C-X3-H)基序。利用DBSubLoc预测这20个基因都定位与细胞核内,用Perl语言编写的程序检索拟南芥基因组表明,拟南芥亚家族IX的所有基因都含有NES序列核输出信号,暗示了这些基因编码的蛋白有可能通过穿梭细胞核起作用。 8.通过Genevestigator上的芯片数据分析和RT-PCR实验表明拟南芥亚家族IX的基因在胁迫处理条件下表达发生变化。 9.利用SWISS-MODEL工具模拟了拟南芥中一个基因CCCH锌指的三维立体结构,并得到了其与RNA结合的构象图。