前言
启动子作为 RNA 聚合酶和一些转录因子结合的靶序列,对转录起始有调节和控制作用,决定着基因表达过程的起始以及在什么条件下开始。因此启动子的识别与分析是表达调控研究的前提和基础。随着越来越多的原核和真核模式生物基因组测序完成,使得研究基因之间的相互作用关系进而构建表达调控网络已经成为可能。而且启动子与结合蛋白的研究能够帮助我们寻找新的功能性蛋白质。启动子分析对于构建基因工程载体,表达目的蛋白有着重要的意义。如何查找并通过实验确定启动子序列是研究启动子功能的前提。启动子分析大多是基于DNA 和蛋白质相互作用的特性。本文从原核和真核启动子的基本结构、分类入手,对常用的几种启动子分析方法,如生物信息学分析方法、酵母单杂交(Y1H)技术、瞬时转染法(TransientTransfection)、染色质免疫共沉淀(ChIP)技术、凝胶阻滞分析(EMSA)试验和 DNA 足纹(DNase I footprinting)分析法等,从原理、优缺点和最新应用等方面的研究进展作一综述,并对近年来出现的新技术新方法的应用前景进行展望,为启动子的结构与功能研究提供借鉴,以进一步促进这一领域研究工作的深入发展。
1 启动子基本结构
1.1 原核生物启动子的结构模型原核生物启动子 (Prokaryote promoter) 长度一般为 20bp~200 bp,细菌启动子常由四部分组成[1]: CAT 序列,转录起始位点;Pribnow 框,即转录起始位点 .10 位置,有一段共有序列TATAAT,是 RNA 聚合酶的结合位点,启动子的强度很大程度上是由这一序列的核苷酸构造所决定;Sextama 框,位于 .35区,其共有序列是 TTGACA,是 RNA 聚合酶的识别位点;间隔区:两段长为 6 个核苷酸保守序列,被长为非特异性的 17~19个核苷酸序列所分隔。在 Pribnow 框和 Sextama 框之间的碱基序列的间隔数十分重要[2].启动子的规模有时相当大,能够包含转录起始位点上游 2000 bp,有些特定基因的转录区内部也存在着转录因子的结合位点。
1.2 真核生物启动子结构模型真核生物启动子(Eukaryotic promoter)主要有三类,分别对应于细胞内的三种 RNA 聚合酶与相关蛋白质。其中Ⅱ类启动子即 RNApolⅡ启动子序列的基本结构特征是,位于转录起点上游 .25~ .30 区有一与原核生物的 Pribnow 框相似的富含AT 碱基对的 TATA 盒(Hogness 盒),TATA 盒有 7 对共有碱基序列:5'. TATA(A/T) A(A/T).3',其功能与原核启动子的 Prib.now 框也相似,决定 RNA 聚合酶 II 的位置,控制转录起始的准确性及效率,此为核心元件[1].大多数真核基因启动子上游距帽位点约 80 ~ 220 bp 处,都存在上游原件,其中有 CAAT 盒,GC 盒等,它们的保守序列与结合蛋白因子也各不相同,可以大大提高的基本启动子的低水平转录活性。
2 启动子分类
根据对转录水平控制的程度,可以将启动子分为弱启动子和强启动子;参照转录模式,启动子又可以分[3]:①组成型启动子(constitutive promoter),该类启动子能够调控结构基因的表达基本恒定在一定程度上,在不同部位或组织表达水平差异不明显。在高等植物转基因工作中,花椰菜花叶病毒(CaMV)35S 启动子,以及来自根癌农杆菌 Ti 质粒 T.DNA 区域的胭脂碱合成酶基因 nos 启动子都得到广泛使用。nos 启动子来自细菌,但具有植物启动子的特性;②组织特异启动子 (tissue.specific pro.moter),该类启动子的调控作用使得基因往往只在某些特定的器官或组织部位表达,且表现出发育调节的特性;③诱导型启动子(inducible promoter),即在某些特定的物理或化学信号刺激后,基因转录水平在该类型启动子调控下大幅度地提升。目前已经分离了众多启动子如热诱导表达基因、光诱导表达基因、创伤诱导表达基因、真菌诱导表达基因和共生细菌诱导表达基因启动子等。而这些诱导型启动子又分为人工构建的诱导型启动子,天然诱导型启动子,阻遏型启动子系统和激活型启动子系统。
Trinklein N D,Krom N,Yang L 和 Dhadi S R 等多位研究者发现[4.7],近年来的生物信息学研究也表明,在人类、蝇、拟南芥、水稻和杨树等动植物基因组中,存在众多的相邻且转录方向相反的基因,称之为"头对头",而当这两个基因相邻的转录起始位点(transcription start site,TSS)之间的距离低于 1 kb 左右时,这段基因间 DNA 序列可称之为"双向启动子"(bidirectionalpromoter),刘石娟等对双向启动子的功能作了介绍[8].