Expresión y Purificación de Proteínas: Fundamentos y Sistemas

Expresión y Purificación de Proteínas

Introducción a la Expresión Génica

La información genética de una célula está contenida en su ADN, el cual contiene la información necesaria para crear miles de moléculas diferentes y, con ello, conformar un individuo completo.

Un organismo procariótico, como una bacteria, consta de millones de nucleótidos, mientras que uno eucariótico, como el ser humano, contiene varios billones. A pesar de contener toda esa información, la célula solo expresa una fracción de sus genes, lo que le otorga un fenotipo característico.

Aunque los diversos tipos de células en un organismo multicelular contienen la misma información genética, su estructura y función difieren ampliamente. Una neurona y un linfocito, por ejemplo, son muy diferentes, por lo que es difícil pensar que estas dos células contienen el mismo genoma, como sucede en realidad. Por esta razón, se creía que los genes se perdían cuando las células se diferenciaban.

Ahora se sabe que las células de un organismo multicelular son distintas porque sintetizan diferentes ARN mensajeros (ARNm) y, por ende, diferentes proteínas a partir del mismo genoma.

Importancia y Utilidad de la Expresión Genética

strong>, regulados por señales recibidas por las células, y concluye con la producción de un ARN funcional y, posteriormente, en el caso de los ARNm, con la traducción de una proteína madura y activa. Los factores de transcripción son proteínas de unión al ADN que reconocen una secuencia específica y se requieren para el

La expresión de un gen se regula en diferentes niveles, desde su inicio hasta su terminación.

Sistemas de Expresión de Proteínas Recombinantes

TIPO DE SISTEMA DE EXPRESIÓN

Procariota (E. coli)

Eucariota (células de mamífero)

Libre de células

  • Existe un alto nivel de conocimientos sobre su biología y genética.
  • Facilidad de manipulación.
  • Alta densidad de cultivo.
  • Sistema de producción económico.
  • Amplia variedad de vectores de expresión.
  • Bajo nivel de secreción de proteínas al medio.
  • No realiza modificaciones postraduccionales.
  • Genera proteasas que pueden afectar el rendimiento.
  • La producción de proteínas heterólogas induce proteólisis celular.
  • Genera proteínas con plegamiento correcto y modificaciones postraduccionales, similares a las proteínas nativas o endógenas.
  • Sistema empleado para la producción de proteínas para usos industriales, especialmente terapéuticos.
  • Rendimiento de producción bajo.
  • Tasa de crecimiento lento.
  • Alto costo debido a los medios de cultivo y adaptación de las células animales.
  • Sistema vulnerable a contaminación.
  • Permite la producción de proteínas recombinantes más rápido en comparación con métodos tradicionales.
  • Genera proteínas con plegamiento correcto y modificaciones postraduccionales, similares a las proteínas nativas.
  • Sistemas que pueden producir proteínas de longitud completa y funcionalmente activas.
  • Alta velocidad de producción y niveles de expresión.
  • Bajo nivel de escalamiento.
  • Alto costo.

Fases de la Síntesis de Proteínas

Activación de los Aminoácidos

La reacción de activación tiene lugar en dos pasos separados en el sitio activo de la enzima.

Aminoácido + ARNt + ATP → aminoacil-ARNt + AMP + PPi

En el primer paso se forma un intermediario ligado a la enzima, aminoacil-adenilato (aminoacil-AMP), por reacción de ATP y el aminoácido en el sitio activo. En esta reacción, el grupo carboxilo del aminoácido se une con el grupo fosfato 5′ del AMP con desplazamiento de pirofosfato. En el segundo paso, se transfiere el grupo aminoacilo desde el aminoacil-AMP a su correspondiente ARNt específico. Este paso se realiza de forma distinta según la clase de enzima que lleve a cabo la reacción (aminoacil-ARNt sintetasas clase I o clase II). En el ribosoma no se comprueba la identidad del aminoácido unido al ARNt; por este motivo, la unión del aminoácido correcto a cada ARNt es esencial para la fidelidad de la síntesis proteica en su conjunto. La forma en que se discrimina entre dos aminoácidos similares que puedan ser sustratos de estas enzimas se ha estudiado ampliamente en el caso de la Ile-ARNtIle sintetasa. La valina difiere de la isoleucina solamente en un grupo metileno (CH₂), y aunque la incorporación de la Ile se ve favorecida en un factor de 200, la valina se incorpora en posiciones de isoleucina con una frecuencia de solo 1 en unas 3000 (que es mucho menor de lo esperado). Esta baja tasa de error se debe a una función de corrección de pruebas (proofreading) de la sintetasa. Debido a que el grupo R de la valina es ligeramente más pequeño que el de la isoleucina, el Val-AMP encaja en un sitio hidrolítico específico de la enzima y se rompe el complejo, no concluyendo la formación del Val-ARNtIle. Esta es una de las formas en que las sintetasas corrigen su posible error en la formación del aminoacil-ARNt. Por otro lado, estas enzimas también son capaces de hidrolizar el enlace éster entre el aminoácido y el ARNt una vez concluida la reacción, sobre todo en aquellos casos en que el aminoácido cargado no sea el correcto. Con todo esto se garantiza que el grado de fidelidad sea suficiente para asegurar que la mayoría de las proteínas no contengan errores y que la gran cantidad de energía utilizada en su síntesis no se despilfarre. No obstante, hay que observar que la tasa de error medio (1 aminoácido por 10⁴ incorporados) no es tan baja como en la replicación, probablemente porque un error en una proteína se borra destruyéndola y, por tanto, no la heredan generaciones futuras.

Etapas de la Traducción

  1. Inicio

    La síntesis de las cadenas polipeptídicas empieza en el extremo amino-terminal y se alarga por adición secuencial de residuos al extremo carboxilo-terminal. Aunque solo existe un codón para la Met (AUG), todos los organismos contienen dos ARNt para este codón. Uno de ellos se utiliza exclusivamente cuando AUG representa el codón de inicio de la síntesis, y el otro cuando la metionina debe ser introducida en una posición interna del polipéptido. En bacterias, estos ARNt se denominan ARNtfMet y ARNtMet, ya que el residuo que constituye el extremo amino-terminal es la formilmetionina.

    En las células eucarióticas, todos los péptidos citosólicos comienzan con un residuo de Met, pero aquí también se utiliza un ARNt especializado distinto del utilizado para posiciones interiores. Los polipéptidos sintetizados por los ribosomas mitocondriales y de los cloroplastos eucariotas comienzan con N-formilmetionina. Centrándonos en la fase de inicio de proteínas bacterianas, la reacción requiere:

    • La subunidad ribosómica 30S, que contiene ARNr 16S.
    • El ARNm que codifica el polipéptido que se va a sintetizar.
    • El fMet-ARNtfMet iniciador.
    • Un conjunto de tres proteínas denominadas factores de inicio (IF-1, IF-2, IF-3).
    • GTP.
    • Mg++.

    La formación del complejo de inicio tiene lugar en tres pasos. En el primer paso, la subunidad 30S fija el IF-3, que impide que la subunidad 50S se una de forma prematura. A continuación, se une el ARNm de tal forma que el codón de inicio (AUG) se une en un lugar preciso de la subunidad 30S que viene marcado por una señal iniciadora o secuencia de Shine-Dalgarno. En el segundo paso del proceso, se une el IF-2 (que ya viene unido a GTP) y también se incorpora el fMet-ARNtfMet iniciador, apareándose el codón-anticodón. Por último, este complejo se combina con la subunidad ribosómica 50S; simultáneamente, la molécula de GTP ligada a IF-2 se hidroliza a GDP y Pi, que se liberan. También se desprenden IF-3 e IF-2 del ribosoma. Una diferencia principal entre procariotas y eucariotas en la síntesis de proteínas es la existencia de al menos nueve factores de inicio eucarióticos, entre los que destaca la proteína fijadora del casquete (CBP), que se fija al casquete 5′ del ARNm facilitando la formación de un complejo entre el ARNm y la subunidad ribosómica 40S.

  2. Elongación

    En la elongación se requiere:

    • El complejo de inicio formado anteriormente.
    • El siguiente aminoacil-ARNt específico del siguiente codón.
    • Factores de elongación (EF-Tu, EF-Ts y EF-G).
    • GTP.

    La adición de cada nuevo residuo de aminoácido tiene lugar en tres pasos. En el segundo paso, se forma un nuevo enlace peptídico entre los aminoácidos unidos mediante sus ARNt a los sitios A y P del ribosoma. Esta reacción produce un dipeptidil-ARNt en el sitio A, mientras que el ahora descargado (desacilado) ARNtfMet permanece unido al sitio P. La actividad enzimática que cataliza la formación de este enlace peptídico y que se conoce como peptidiltransferasa, se atribuía hasta hace poco a proteínas de la subunidad grande; sin embargo, en 1992 Harry Noller descubrió que el responsable de esta reacción era el ARNr 23S, añadiendo una nueva e importante función biológica a las ribozimas. En el tercer paso, denominado translocación, el ribosoma se desplaza la distancia de un codón hacia el extremo 3′ del ARNm. Debido a que el dipeptidil-ARNt está aún unido al segundo codón del ARNm, el desplazamiento del ribosoma lo traslada desde el sitio A al sitio P, mientras que el ARNt desacilado se desprende del sitio P, volviendo al citosol. En este paso se requiere el EF-G (translocasa) y la energía proporcionada por la hidrólisis de otra molécula de GTP.

  3. Terminación y Liberación

    La terminación está señalada por uno de los tres codones de terminación existentes en el ARNm (UAA, UAG, UGA). En las bacterias, cuando un codón de terminación ocupa el sitio A, intervienen tres factores de terminación o de liberación (RF1, RF2 y RF3). Estos factores contribuyen a:

    1. La hidrólisis del enlace peptidil-ARNt terminal.
    2. La liberación del polipéptido libre.
    3. La disociación del ribosoma 70S en sus subunidades 30S y 50S.

    RF1 reconoce los codones de terminación UAG y UAA, y RF2 reconoce UGA y UAA. Uno de estos factores se fija a un codón de terminación e induce a la peptidiltransferasa a transferir la cadena polipeptídica creciente a una molécula de agua en lugar de a otro aminoácido. No se conoce la función de RF3. En los eucariotas, un solo factor de liberación, eRF, reconoce los tres codones de terminación.

Polisomas: Fábricas de Proteínas

A partir tanto de células eucarióticas como bacterianas se pueden aislar grandes agrupamientos de 10 a 100 ribosomas que son muy activos en la síntesis de proteínas. Tales agrupamientos, denominados polisomas, se pueden fragmentar en ribosomas individuales por acción de la ribonucleasa. La hebra que mantiene unidos estos ribosomas es ARNm; este ARNm es traducido simultáneamente por muchos ribosomas, lo que permite una utilización más eficiente del mismo. En las bacterias, los ARNm se sintetizan y se traducen en dirección 5’→3′. Los ribosomas empiezan a traducir el extremo 5′ del ARNm antes de que se haya completado la transcripción. La situación es algo diferente en los eucariotas, donde los ARNm recién transcritos han de ser transferidos fuera del núcleo para que puedan ser traducidos.

Plegamiento y Maduración: Modificaciones Postraduccionales

Desde la síntesis hasta que la proteína adquiere su forma biológicamente activa, la cadena polipeptídica sufre una serie de reacciones de modificación, o maduración, denominadas modificaciones postraduccionales.

Los tipos de modificaciones postraduccionales, tanto en procariotas como en eucariotas, pueden agruparse en:

  • Modificaciones amino-terminales y carboxilo-terminales: Los extremos terminales del polipéptido formado sufren modificaciones. La evidencia de esto es que, si bien todas las proteínas empiezan con metionina o formilmetionina, tras su maduración no es este el aminoácido que siempre está presente en el extremo N-terminal.
  • Pérdida de secuencia señal: Existen de 15 a 30 aminoácidos del extremo N-terminal que sirven para dirigir a la proteína a su destino final. Estos residuos reciben el nombre de secuencia señal y se eliminan mediante peptidasas específicas una vez concluida su función.
  • Modificaciones de aminoácidos concretos: El significado funcional de esta modificación varía de una proteína a otra. Por ejemplo, la proteína de la leche, la caseína, tiene muchos grupos fosfoserina que actúan fijando Ca2+. Dado que se necesita tanto calcio como fosfato, así como aminoácidos, para el bebé lactante, la caseína aporta tres nutrientes esenciales.
  • Unión de cadenas laterales glucídicas: Son cadenas de glúcidos que se unen covalentemente a las glucoproteínas durante o después de la síntesis.
  • Adición de grupos isoprenilo: En algunos casos, este grupo sirve para anclar la proteína a la membrana.
  • Adición de grupos protésicos: Por ejemplo, el grupo hemo de la hemoglobina.
  • Modificaciones proteolíticas: Muchas proteínas, por ejemplo la insulina, se sintetizan en forma de precursores más largos e inactivos que posteriormente han de ser cortados proteolíticamente para dar sus formas activas finales.
  • Formación de puentes disulfuro: Son puentes que se forman entre dos residuos de cisteína (Cys) para dar la conformación nativa o funcional de la proteína.

Sistemas de Expresión Específicos

Expresión de Proteínas en Virus

Los rotavirus, pertenecientes a la familia Reoviridae, son los principales agentes causales de diarrea aguda y deshidratante que afecta a los infantes menores de cinco años y a animales jóvenes. Su partícula viral está formada por tres capas proteicas: la capa más externa, compuesta por las proteínas estructurales VP4 y VP7; la capa media, formada por la proteína VP6; y la capa interna, formada por VP2, la cual encierra las proteínas VP1 y VP3 y el genoma viral, compuesto por 11 segmentos de ARN de doble cadena (dsRNA). Estos segmentos codifican las seis proteínas estructurales y seis proteínas no estructurales (NSP1 – NSP6) involucradas en el ciclo viral del rotavirus, incluyendo la replicación, transcripción, traducción y formación de nuevas partículas infecciosas. La eficiente infectividad del rotavirus depende de que la proteína VP4 sea enzimáticamente fragmentada en VP8* y VP5*.

Expresión de Proteínas en Bacterias

Los sistemas de expresión de proteínas se han utilizado ampliamente con diferentes propósitos en la investigación básica y en las aplicaciones biotecnológicas. Los denominados vectores de expresión han sido de gran utilidad en este propósito al permitir la captación del material genético foráneo y la subsecuente transcripción del gen de interés, seguida de su traducción en el ambiente bacteriano. La expresión de proteínas heterólogas comúnmente resulta en su acumulación en forma insoluble, dando origen a cuerpos de inclusión, cuya solubilización implica tratamientos con detergentes, seguido de procedimientos dirigidos a conseguir la renaturalización de la proteína foránea. Escherichia coli (E. coli) es el organismo más utilizado para la expresión heteróloga de proteínas debido a sus ventajas ampliamente documentadas. En el caso de proteínas de rotavirus, VP5* y VP8* han sido expresadas utilizando vectores de expresión plasmídicos y virales. Sin embargo, la solubilidad o insolubilidad de estas proteínas en sistemas heterólogos ha dependido del sistema de expresión utilizado.

Debido a que los organismos procariotas carecen de un núcleo celular, los procesos de transcripción y traducción ocurren casi simultáneamente. Cuando la proteína ya no es necesaria, la transcripción se detiene. Cuando no hay ARNm presente, no se puede producir ninguna proteína. Como resultado, el método primario para controlar qué tipo y cuánta proteína se expresa en una célula procariota es a través de la regulación de la transcripción del ADN en ARN. Todos los pasos posteriores ocurren automáticamente. Cuando se requiere más proteína, se produce más transcripción. Por lo tanto, en las células procariotas, el control de la expresión génica se encuentra casi en su totalidad a nivel transcripcional.

Expresión de Proteínas en Eucariotas

Las células eucariotas, por el contrario, tienen orgánulos intracelulares y son mucho más complejas. Recordemos que en las células eucariotas, el ADN está contenido dentro del núcleo de la célula y ahí es donde se transcribe para producir ARNm. El ARNm recién sintetizado es transportado fuera del núcleo hacia el citoplasma, donde los ribosomas traducen el ARNm para producir la proteína. Los procesos de transcripción y traducción están físicamente separados por la membrana nuclear; la transcripción ocurre solo dentro del núcleo, y la traducción solo ocurre fuera del núcleo, en el citoplasma. La regulación de la expresión génica puede ocurrir en cualquier etapa del proceso:

  • Nivel epigenético: Regula la fuerza con la que se enrolla el ADN alrededor de las proteínas histonas para empaquetarlo en cromosomas.
  • Nivel transcripcional: Regula la cantidad de transcripción que se lleva a cabo.
  • Nivel postranscripcional: Regula aspectos del procesamiento del ARN (como el corte y empalme o splicing) y el transporte fuera del núcleo.
  • Nivel traduccional: Regula la cantidad del ARN que se traduce en proteína.
  • Nivel postraduccional: Regula cuánto tiempo dura la proteína después de que se haya elaborado y si la proteína se procesa en una forma activa.

Figura: La expresión génica eucariota se regula durante la transcripción y el procesamiento del ARN, los cuales tienen lugar en el núcleo, así como durante la traducción de proteínas, que tiene lugar en el citoplasma. La regulación adicional puede ocurrir a través de modificaciones postraduccionales de proteínas.

Diferencias Clave en la Regulación Génica de Procariotas y Eucariotas

Organismos procariotas

Organismos eucariotas

Carecen de núcleo.

Contienen núcleo.

La transcripción de ARN y la traducción de proteínas ocurren casi simultáneamente.

La transcripción del ARN ocurre antes de la traducción de proteínas y tiene lugar en el núcleo. La traducción de ARN a proteína ocurre en el citoplasma.

El postprocesamiento de ARN incluye la adición de una caperuza 5′, cola de poli-A, escisión de intrones y empalme de exones.

La expresión génica está regulada principalmente a nivel transcripcional.

La expresión génica está regulada en muchos niveles (epigenético, transcripcional, postranscripcional, traduccional y postraduccional).

Técnicas de Separación y Purificación de Proteínas

  • Cromatografía de Proteínas
    • Cromatografía de intercambio iónico
    • Cromatografía de cribado molecular
    • Cromatografía de afinidad
  • Electroforesis de Proteínas
    • Electroforesis en papel de filtro
    • Electroforesis en acetato de celulosa
    • Electroforesis en geles de agarosa
    • Electroforesis en geles de poliacrilamida

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *