Elaboración de guiones para el estudio interactivo de la relación estructura-función de proteínas

TATA-box binding protein (TBP)

Introducción


Nuestras células contienen 30.000 genes compuestos por millones de nucleótidos. Para cada gen, es necesario que la célula sea capaz de iniciar la transcripción en el lugar y en el momento adecuado. En este proceso, la proteína TATA-box binding protein, conocida también como TBP, juega un papel muy importante, como veremos a continuación.


Los organismos eucariotas presentan tres tipos distintos de RNA polimerasas (tipo I, II y III) encargadas de catalizar la transcripción de los genes nucleares. A pesar de su complejidad estructural, estas enzimas de varias subunidades necesitan la participación de proteínas auxiliares denominadas factores de transcripción (TFs). Los tres tipos diferentes de RNA polimerasas requieren la participación de TBP para poder llevar a cabo su función, lo que convierte a esta proteína en un factor de transcripción universal.


La proteína TBP reconoce una secuencia característica de nucleótidos del DNA denominada TATA-box (caja TATA), uniéndose a ella con gran afinidad (Kd = 2-4 × 10-9 M) y marcando el punto de inicio de la transcripción. Se estima que, aproximadamente el 24 % de los genes humanos contienen la TATA-box en sus promotores, pero la mayoría de estos genes se asocian con procesos y funciones que han de ser altamente regulados. La secuencia característica de la TATA-box consiste en T-A-T-A-a/t-A-a/t, donde a/t se refiere posiciones que pueden ser A o T.


El papel de TBP en el inicio y regulación de la transcripción se comprende mejor para aquellos genes transcritos por la RNA pol II junto con factores de iniciación TFIIA, -B, -D, -E, -F, -G/J, H e –I. La función de TBP en la transcripción mediada por las polimerasas tipo I y III es menos comprendida. TBP se encuentra formando parte de un complejo multiproteico denominado TFIID, en el cual TBP se asocia fuertemente a otros polipéptidos. Asimismo, TBP interacciona directamente con los factores de iniciación de la transcripción TFIIA y TFIIB, con el extremo C-terminal de la subunidad mayor de la RNA pol II, algunos cofactores inhibidores de la transcripción (NC1, NC2, DR1), y un activador de la transcripción (TFII-I) que puede tener relevancia en la transcripción de los genes que no contienen la caja TATA en sus promotores.

Estructura


La estructura de la proteína TBP muestra una única cadena polipeptídica con simetría bilateral compuesta por dos dominios (de unos 88-89 aminoácidos cada uno de ellos) topológicamente idénticos. Cada uno de los dominios se compone de 5 hebras β antiparalelas y dos hélices α. Los dos dominios se encuentran unidos por un pequeño polipéptido (normalmente denominado como el péptido de unión).

Esquema de la estructura de TBP-2 de Arabidopsis thaliana
Figura 1. Esquema de la estructura de TBP-2 de Arabidopsis thaliana determinada por cristalografía de rayos X. Las hélices α se muestran con forma de rectángulo y las hebras β con forma de flecha. El símbolo ‘ hace referencia a las estructuras secundarias que constituyen el segundo dominio (Nikolov et al. Proc Natl Acad Sci U S A. 1996 May 14;93(10):4862-7.)

La simetría bilateral intramolecular de la TBP, genera una estructura similar a una “silla de montar” con unas dimensiones de 32 Å × 45 Å × 60 Å.

Estructura cristalizada de TATA-box binding protein (TBP) de levadura


Las hebras β antiparalelas forman la cara cóncava de la silla, y se encarga de interaccionar con los surcos menores de la doble hélice del DNA. Por su parte, la cara convexa se compone de 4 hélices α, el péptido de unión que une ambos dominios, parte de dos hebras β (S1, S1’ en la imagen) y de los 18 aminoácidos no conservados del extremo N-terminal. Esta cara superior se encarga de interaccionar con otras proteínas y factores de la maquinaria de transcripción. La disposición de las hélices α y hebras β en cada dominio, permiten la formación de un núcleo hidrofóbico para la interacción con el DNA.

Conservación evolutiva


El extremo C-terminal de la TBP se compone de 180 aminoácidos, reconoce el surco menor del DNA y promueve la torsión del DNA. Diferentes estudios filogenéticos muestran que existe conservación en la secuencia de los 180 aminoácidos.


El extremo N-terminal varía de longitud, presenta poca o ninguna conservación entre diferentes organismos, llegando a ser innecesaria para la transcripción en algunas cepas de levadura.


Por último, aunque los dos dominios α/β son topológicamente idénticos, muestran un 30 % de similitud en sus aminoácidos, y un 50 % con respecto a sus nucleótidos. El antecesor de TBP podría haber sido un dímero, el cual, mediante duplicación y fusión de genes, pudo haber desembocado en la TBP monomérica actual.

Mecanismo de unión al DNA


Por último, aunque los dos dominios α/β son topológicamente idénticos, muestran un 30 % de similitud en sus aminoácidos, y un 50 % con respecto a sus nucleótidos. El antecesor de TBP podría haber sido un dímero, el cual, mediante duplicación y fusión de genes, pudo haber desembocado en la TBP monomérica actual.

  • Interacciones electrostáticas: existen varios residuos de lisina y arginina (aminoácidos con carga positiva) que son capaces de interaccionar mediante fuerzas electrostáticas con los grupos fosfato (grupos con carga negativa) del esqueleto externo de la doble hebra de DNA. También se pueden producir pequeñas interacciones entre estos grupos fosfato y residuos de serina de la proteína.

  • Aminoácidos que participan en interacciones electrostáticas entre TBP y DNA
  • Interacciones hidrofóbicas: también existen cuatro aminoácidos de fenilalanina que se encuentran en las láminas β de la TBP orientados hacia el exterior. Estos residuos dispuestos dos a dos son capaces de establecer interacciones hidrofóbicas con las bases nitrogenadas del DNA.

  • Aminoácidos que participan en interacciones hidrofóbicas entre TBP y DNA
  • Puentes de hidrógeno: en el centro de la TBP existen dos residuos de asparagina y dos residuos de treonina colocados de forma simétrica dos a dos que son capaces de formar enlaces de hidrógeno con las bases situadas en la posición central de la hebra de DNA, concretamente con átomos de nitrógeno y oxígeno de las bases nitrogenadas. Los residuos de glicina marcados en la imagen no forman puentes de hidrógeno con las bases directamente, sino que los forman con los residuos de treonina y asparagina.
  • IAminoácidos que participan en la formación de puentes de hidrógeno entre TBP y DNA
    Figura 2. Aminoácidos que participan en la formación de puentes de hidrógeno entre TBP y DNA (Pardo et al. Biophys J. 2000 Apr;78(4):1988-96.)

    Distintos tipos de interacciones por medio de puentes de hidrógeno con bases adyacentes mediante Thr, Asn y Gly. (Pardo et al. Biophysical journal (2000) 78 (4): 1988-1996).


Como hemos visto, la secuencia TATA del DNA se caracteriza por contener múltiples pares adenina-timina, en la que pueden existir ligeras variaciones entre especies, aunque el patrón suele ser el mismo. Como es sabido, las bases nitrogenadas de los pares A=T se unen sólo mediante dos puentes de hidrógeno, al contrario que los pares G≡C, que se unen por tres. Esto provoca que las zonas del DNA en las que se repitan mucho estos pares A=T sean regiones cuyas hebras se unen de forma más débil que en las demás, por lo que, entre otras características, en estas zonas el DNA tiene una gran capacidad de flexión. Como se ve en las imágenes, la TBP no sólo se une sino que además produce una flexión de la molécula de DNA de unos 80˚ para facilitar la formación de este complejo DNA-TBP.


La combinación de estas tres tipos de interacciones, así como la inusual flexibilidad de la TATA-box permiten a la TBP reconocer esta secuencia específicamente para comenzar con los procesos de transcripción.

Mecanismo de unión a factores de transcripción


La TBP no solo contiene el dominio de unión del factor de transcripción TFIID al DNA por la secuencia consenso TATA box, sino que también supone el punto de interacción de TFIID con otros factores implicados en el inicio de la transcripción, en concreto, TFIIA y TFIIB. La pseudosimetría de TBP permite que cada mitad de la proteína interaccione específicamente con uno de estos factores: en el N-terminal se localizan los puntos de interacción con TFIIA, y en el C-terminal los de TFIIB.

TFIIB


El factor de transcripción TFIIB está formado por dos dominios con muchos motivos alfa hélice pero con una superficie diferente, lo que permite interacciones diferenciadas. TFIIB interacciona con TBP por su extremo C-terminal (84 aminoácidos en repeticiones directas) cuando forma el complejo TBP-TATA y provoca un aumento de su afinidad por el promotor. Además interacciona también con el esqueleto fosforribosa del DNA por encima y por debajo de la caja TATA, actuando como una pinza, causando un giro entre los dos dominios de TBP y constituyendo así el complejo TFIIB-TBP-caja TATA. En la interacción entre TBP y TFIIB encontramos tres clases de interacciones, van der Waals, puentes iónicos y de hidrógeno:

  1. Con el extremo C-terminal de TBP: Participan los aminoácidos de 143-147 de TBP con 10 residuos de TFIIB posicionados más distanciados entre ellos.


  2. Interacciones de TFIIB con el extremo C-terminal de TBP. En verde están marcados los residuos de TBP que participan en la interacción y en azul los diferentes residuos de TFIIB.
  3. Con la hélice alfa H1 de TBP: Participan dos residuos de TBP (Glu131 y Tyr135) y dos de TFIIB (Asp207 y Leu208).

  4. Interacciones de TFIIB con la hélice α H1 de TBP. En verde están marcadas las cadenas laterales de los residuos de TBP (carbono α en rojo) y en azul los de TFIIB (carbono α en negro).
  5. Con la Lisina 197 de TBP: Un puente salino entre esa lisina y el aspártico 243 de TFIIB.

  6. Interacción de la Lys197 de TBP con el Asp243 de TFIIB.

Interacción con TFIIA


TFIIA está compuesto por tres subunidades, llamadas α, β y γ. Los puntos de interacción en TFIIA se localizan en dos regiones: la hebra S2 de TFIIAγ y el extremo C terminal de TFIIAβ. Por parte de TBP, los puntos de interacción se localizan todos en la mitad N-terminal: en la hélice H1, en la hebra S2 y S3, y en el bucle de unión de S3 a S4. En concreto, las relaciones entre estos puntos de interacción ocurren de la siguiente manera: la hebra S2 de TFIIAγ interacciona tanto con la hélice H1 como con las hebras S2 y S3 de TBP. El C-terminal de TFIIAβ interacciona con el bucle de unión de S3 a S4 de TBP. Esta interacción es curiosa porque involucra a la Arg208 de TBP, que es la misma Arg que interacciona con los fosfatos del DNA. Efectivamente, este residuo rompe su interacción con los fosfatos del DNA y rota para formar un puente salino con el C-terminal de TFIIAβ.


Superficies de interacción entre TBP y TFIIA. Se resaltan en azul oscuro las regiones de TBP relacionadas con la interacción con TFIIA y, en verde, las de TFIIA que interaccionan con TBP. Las cadenas laterales de los aminoácidos que interaccionan han sido omitidas para no complicar la imagen.


El patrón exacto de interacciones entre TBP y TFIIA es muy complejo para detallar aquí cuáles son y de qué forma están involucrados los aminoácidos que las forman, aunque una característica general de dichas interacciones, además de dónde se localizan, es que a menudo la cadena lateral de un aminoácido interacciona con el enlace peptídico de otro, en lugar de darse una interacción entre ambas cadenas laterales.


Sin embargo, sí que cabe señalar que el patrón de interacciones hace que TFIIA se una específicamente a la mitad N-terminal de TBP. Podríamos pensar que, dada la similitud estructural entre las mitades N y C-terminal de TBP, TFIIA podría unirse a cualquiera de las dos. Esto, no obstante, no ocurre, porque a pesar de que las mitades N y C-terminal de TBP son muy similares, no son idénticas, sino solo pseudosimétricas. Si TFIIA se uniera a la región C-terminal de TBP, no existirían muchas de las interacciones estabilizantes que sí se dan con la mitad N-terminal, y aparecerían impedimentos estéricos que dificultarían dicha unión. Esto provoca que TFIIA se una siempre preferentemente a la región N-terminal. Es esta “especificidad de estructura” la responsable de que cada factor de transcripción se una a su sitio correspondiente (TFIIA a la mitad N-terminal y TFIIB a la C-terminal), y se pueda construir siempre de forma inequívoca el complejo macromolecular multiproteico formado por TBP (incluida en el entorno de TFIID) y sus factores de transcripción asociados (TAFs), cuyo correcto ensamblaje es esencial para el inicio de la transcripción y para que ésta transcurra en la polaridad correcta: la transcripción se desarrolla en el sentido que va hacia TFIIB, opuesto al que va hacia TFIIA, como se puede observar en la siguiente figura.

Estructura del complejo promotor TFIID-TFIIA
Figura 3. Estructura del complejo promotor TFIID-TFIIA: vistas ortogonales del núcleo de TFIID unido al promotor, excluyendo al lóbulo flexible A2. Obsérvese que TFIIA y TFIIB marcan la polaridad de la transcripción: ésta se desarrolla en sentido hacia TFIIB, opuesto al sentido de TFIIA. (Nogales et al. Curr Opin Struct Biol. 2017 Dec;47:60-66.)


Guion elaborado por Pablo Berrocal Navarro, Adrián González López, Álvaro Huertas García y Marcos Manrique Crespo, alumnos de Química e Ingeniería de Proteínas, 3er curso del Grado en Biotecnología, curso 2017/18.

Referencias

R. G. Roeder. The role of general initiation factors in transcription by RNA polymerase II. Trends Biochem Sci. 1996 Sep;21(9):327-35.

Z. S. Juo, T. K. Chiu, P. M. Leiberman, I. Baikalov, A. J. Berk and R. E. Dickerson. How proteins recognize the TATA box. J Mol Biol. 1996 Aug 16;261(2):239-54.

L. Pardo, N. Pastor, H. Weinstein. Selective binding of the TATA box-binding protein to the TATA box-containing promoter: analysis of structural and energetic factors. Biophys J. 1998 Nov;75(5):2411-21.

L. Pardo, M. Campillo, D. Bosch, N. Pastor, H. Weinstein. Binding mechanisms of TATA box-binding proteins: DNA kinking is stabilized by specific hydrogen bonds. Biophys J. 2000 Apr;78(4):1988-96.

S.K. Burley. The TATA box binding protein. Curr Opin Struct Biol. 1996 Feb;6(1):69-75.

D.B. Nikolov , H. Chen H, E.D. Halay, A. Hoffman, R.G. Roeder, S.K. Burley . Crystal structure of a human TATA box-binding protein/TATA element complex. Proc Natl Acad Sci U S A. 1996 May 14;93(10):4862-7.

E. Nogales, A.B. Patel, R.K. Louder. Towards a mechanistic understanding of core promoter recognition from cryo-EM studies of human TFIID. Curr Opin Struct Biol. 2017 Dec;47:60-66.

M. Bleichenbacher, S. Tan, T.J. Richmond. Novel Interactions Between the Components of Human and Yeast TFIIA/TBP/DNA Complexes. J Mol Biol. 2003 Sep 26;332(4):783-93.

Nikolov, Dimitar B., et al. "Crystal structure of a TFIIB-TBP-TATA-element ternary complex." Nature 377.6545 (1995): 119-128.