Información

Células embrionarias, ¿cuándo se pueden detectar in vivo? (Para realizar la secuenciación del genoma completo)

Células embrionarias, ¿cuándo se pueden detectar in vivo? (Para realizar la secuenciación del genoma completo)


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Me preguntaba cuándo es posible extraer células (humanos o ratones) para secuenciarlas y detectar enfermedades. Extra: La orina del embrión en humanos se excreta en la semana 16, así que supongo que luego es posible extraer algunas células embrionarias.

EDITAR En otras palabras, ¿cuándo es posible obtener suficiente ADN para conocer el genoma completo del embrión sin dañarlo? Para secuenciarlo y evitar la mayoría de enfermedades genéticas y regular los límites de aborto semanal.

Gracias


Como de costumbre, la respuesta es "depende de lo que quieras decir". Existe un gran campo existente (pruebas de diagnóstico genético prenatal) que intenta diagnosticar enfermedades genéticas en fetos utilizando diferentes tecnologías. Estas tecnologías se describen con más detalle en los puntos 2 y 3 a continuación, mientras que el punto 1 es una declaración un tanto académica sobre las capacidades técnicas de la tecnología genómica en entornos de investigación pura que actualmente no son realmente relevantes para las aplicaciones médicas.

Puedo pensar en 3 respuestas diferentes a la pregunta tal como se planteó originalmente:

  1. Con la tecnología de secuenciación disponible actualmente, nunca se puede conocer la secuencia completa del genoma de un ser humano lo suficientemente bien como para ver todas las variantes potencialmente dañinas. De hecho, el genoma de referencia humano "terminado" tiene lagunas y errores que se corrigen constantemente. Para obtener más información sobre lo que significa "terminado", consulte aquí. Hasta donde yo sé, solo existe un ensamblaje de un cromosoma humano de telómero a telómero, y ese es solo el cromosoma X. Incluso aceptando que esta mejor tecnología disponible es lo suficientemente buena, también se basa en cosas como la capacidad de aislar una gran cantidad de ADN de alto peso molecular, lo que hace que sea muy difícil de hacer con la cantidad de células que se pueden obtener de un recién nacido sin una gran cantidad de ADN. procedimientos invasivos como, por ejemplo, muestreo de tejido fetal in vivo. Supongo que incluso la amniocentesis sería muy difícil de obtener un buen ADN de HMW.

  2. Sin embargo, con la tecnología de secuenciación disponible en la actualidad, puede realizar la prueba muy temprano siempre que haya utilizado la FIV, al menos en la etapa de 100 células (probablemente antes). Este es un método más arriesgado que perderá mucha información, pero le brinda información lo suficientemente buena como para diagnosticar aneuploidías u otras variantes muy obvias.

  3. Alternativamente, puede analizar el ADN fetal libre de células a las 7 semanas (o posiblemente antes). Sin embargo, esto no implica aislar células, por lo que potencialmente no es lo que está pensando. Es una información algo mejor que la evaluación previa al implante, pero es peor información de la que se puede obtener de las células completas.

Es probable que ninguna de esas sea exactamente la respuesta que desea, pero también es una pregunta menos simple de lo que parece al principio: a) obtener celdas es difícil y probablemente no sea necesario para la tecnología actual, yb) la tecnología no es tan buena como se anuncia generalmente.


Células embrionarias, ¿cuándo se pueden detectar in vivo? (Para realizar la secuenciación del genoma completo) - Biología

La célula madre embrionaria humana (hESC) se puede derivar de un solo blastómero embrionario de ocho células.

La hESC se puede derivar, expandir y mantener en condiciones definidas libres de xeno.

La seguridad, funcionalidad y estabilidad de las líneas de hESC se pueden estudiar experimentalmente.

Las terapias clínicas basadas en hESC para varias afecciones están en curso.

El establecimiento de líneas de células madre embrionarias humanas permanentes (hESC) se informó por primera vez en 1998. Debido a su naturaleza pluripotente y su capacidad para diferenciar todos los tipos de células del cuerpo, se las ha considerado una fuente de células para la medicina regenerativa. Desde entonces, se han realizado estudios intensivos sobre los factores que regulan la pluripotencia y la diferenciación. Las hESC se obtienen de embriones humanos supernumerarios de FIV (fertilización in vitro) que no se pueden utilizar para el tratamiento de la infertilidad de la pareja. Hoy en día, podemos establecer y expandir estas células en condiciones libres de sustancias animales, incluso a partir de células individuales biopsiadas de embriones en estadio de ocho células. Existen pruebas satisfactorias para demostrar la estabilidad genética, la ausencia de mutaciones tumorigénicas, la funcionalidad y la seguridad de las hESC. Se están realizando ensayos clínicos para la degeneración macular relacionada con la edad (DMAE) y la lesión de la médula espinal (LME). Esta revisión se centra en el estado actual de estas técnicas.


ChIP-seq se usa principalmente para determinar cómo los factores de transcripción y otras proteínas asociadas a la cromatina influyen en los mecanismos que afectan al fenotipo. Determinar cómo las proteínas interactúan con el ADN para regular la expresión génica es esencial para comprender completamente muchos procesos biológicos y estados patológicos. Esta información epigenética es complementaria al análisis de genotipo y expresión. La tecnología ChIP-seq se considera actualmente principalmente como una alternativa al chip ChIP que requiere una matriz de hibridación. Esto introduce cierto sesgo, ya que una matriz está restringida a un número fijo de sondas. Por el contrario, se cree que la secuenciación tiene menos sesgo, aunque el sesgo de secuenciación de las diferentes tecnologías de secuenciación aún no se comprende por completo. [1]

Los sitios de ADN específicos en interacción física directa con factores de transcripción y otras proteínas pueden aislarse mediante inmunoprecipitación de cromatina. ChIP produce una biblioteca de sitios de ADN diana unidos a una proteína de interés. Los análisis de secuencias masivamente paralelas se utilizan junto con bases de datos de secuencias del genoma completo para analizar el patrón de interacción de cualquier proteína con el ADN, [2] o el patrón de cualquier modificación epigenética de la cromatina. Esto se puede aplicar al conjunto de proteínas y modificaciones capaces de ChIP, como factores de transcripción, polimerasas y maquinaria transcripcional, proteínas estructurales, modificaciones de proteínas y modificaciones del ADN. [3] Como alternativa a la dependencia de anticuerpos específicos, se han desarrollado diferentes métodos para encontrar el superconjunto de todas las regiones reguladoras activas agotadas o interrumpidas por nucleosomas en el genoma, como DNase-Seq [4] y FAIRE-Seq. [5] [6]

ChIP Editar

ChIP es un método poderoso para enriquecer selectivamente las secuencias de ADN unidas por una proteína particular en células vivas. Sin embargo, el uso generalizado de este método se ha visto limitado por la falta de un método suficientemente robusto para identificar todas las secuencias de ADN enriquecidas. El protocolo de laboratorio húmedo de ChIP contiene ChIP e hibridación. Básicamente, hay cinco partes en el protocolo de ChIP [7] que ayudan a comprender mejor el proceso general de ChIP. Para realizar el ChIP, el primer paso es la reticulación [8] utilizando formaldehído y grandes lotes de ADN para obtener una cantidad útil. Los enlaces cruzados se realizan entre la proteína y el ADN, pero también entre el ARN y otras proteínas. El segundo paso es el proceso de fragmentación de la cromatina que rompe la cromatina para obtener piezas de ADN de alta calidad para el análisis de ChIP al final. Estos fragmentos deben cortarse para convertirse en menos de 500 pares de bases [9] cada uno para tener el mejor resultado para el mapeo del genoma. El tercer paso se llama inmunoprecipitación de cromatina, [7] que es la abreviatura de ChIP. El proceso de ChIP mejora los complejos de ADN-proteína reticulados específicos utilizando un anticuerpo contra la proteína de interés seguido de incubación y centrifugación para obtener la inmunoprecipitación. El paso de inmunoprecipitación también permite la eliminación de sitios de unión no específicos. El cuarto paso es la recuperación y purificación del ADN, [7] que tiene lugar mediante el efecto inverso sobre el entrecruzamiento entre el ADN y la proteína para separarlos y limpiar el ADN con una extracción. El quinto y último paso es el paso de análisis del protocolo ChIP mediante el proceso de secuenciación de qPCR, ChIP-on-chip (matriz híbrida) o ChIP. A continuación, se añaden adaptadores de oligonucleótidos a los pequeños tramos de ADN que se unieron a la proteína de interés para permitir una secuenciación masivamente paralela. A través del análisis, las secuencias pueden ser identificadas e interpretadas por el gen o la región a la que se unió la proteína. [7]

Secuenciar editar

Después de la selección del tamaño, todos los fragmentos de ADN de ChIP resultantes se secuencian simultáneamente utilizando un secuenciador de genoma. Un solo ciclo de secuenciación puede buscar asociaciones de todo el genoma con alta resolución, lo que significa que las características se pueden ubicar con precisión en los cromosomas. ChIP-chip, por el contrario, requiere grandes conjuntos de matrices de mosaico para una resolución más baja. [10]

En este paso de secuenciación se utilizan muchos métodos de secuenciación nuevos. Algunas tecnologías que analizan las secuencias pueden utilizar la amplificación de grupos de fragmentos de ADN de ChIP ligados al adaptador en un sustrato de celda de flujo sólido para crear grupos de aproximadamente 1000 copias clonales cada uno. La matriz de alta densidad resultante de grupos de plantillas en la superficie de la celda de flujo se secuencia mediante un programa de análisis del genoma. Cada grupo de molde se somete a secuenciación por síntesis en paralelo utilizando nuevos nucleótidos terminadores reversibles marcados con fluorescencia. Las plantillas se secuencian base por base durante cada lectura. Luego, el software de recolección y análisis de datos alinea las secuencias de muestras con una secuencia genómica conocida para identificar los fragmentos de ADN de ChIP. [ cita necesaria ]

ChIP-seq nos ofrece un análisis rápido, sin embargo, se debe realizar un control de calidad para asegurar que los resultados obtenidos sean confiables:

  • Fracción no redundante: las regiones de baja complejidad deben eliminarse, ya que no son informativas y pueden interferir con el mapeo en el genoma de referencia. [11]
  • Fragmentos en picos: proporción de lecturas que se encuentran en picos sobre las lecturas que se ubican donde no hay un pico. [11]

La sensibilidad de esta tecnología depende de la profundidad del proceso de secuenciación (es decir, el número de etiquetas de secuencia mapeadas), el tamaño del genoma y la distribución del factor diana. La profundidad de secuenciación está directamente relacionada con el costo. Si se tienen que mapear con alta sensibilidad abundantes aglutinantes en genomas grandes, los costos son altos ya que se requerirá un número enormemente alto de etiquetas de secuencia. Esto contrasta con el chip ChIP en el que los costos no están correlacionados con la sensibilidad. [12] [13]

A diferencia de los métodos ChIP basados ​​en microarrays, la precisión del ensayo ChIP-seq no está limitada por el espaciado de las sondas predeterminadas. Al integrar un gran número de lecturas cortas, se obtiene una localización de sitios de unión muy precisa. En comparación con ChIP-chip, los datos de ChIP-seq se pueden utilizar para localizar el sitio de unión dentro de unas pocas decenas de pares de bases del sitio de unión de la proteína real. Las densidades de las etiquetas en los sitios de unión son un buen indicador de la afinidad de unión entre la proteína y el ADN, [14] lo que facilita la cuantificación y comparación de las afinidades de unión de una proteína con diferentes sitios de ADN. [15]

Asociación de ADN STAT1: Se utilizó ChIP-seq para estudiar dianas STAT1 en células HeLa S3 que son clones de la línea HeLa que se utilizan para el análisis de poblaciones celulares. [16] A continuación, se comparó el rendimiento de ChIP-seq con los métodos alternativos de interacción proteína-ADN de ChIP-PCR y ChIP-chip. [17]

Arquitectura de nucleosomas de promotores: Usando ChIP-seq, se determinó que los genes de levadura parecen tener una región promotora libre de nucleosomas mínima de 150 pb en la que la ARN polimerasa puede iniciar la transcripción. [18]

Conservación del factor de transcripción: Se utilizó ChIP-seq para comparar la conservación de TF en el prosencéfalo y el tejido cardíaco en ratones embrionarios. Los autores identificaron y validaron la funcionalidad cardíaca de los potenciadores de la transcripción y determinaron que los potenciadores de la transcripción del corazón están menos conservados que los del prosencéfalo durante la misma etapa de desarrollo. [19]

ChIP-seq en todo el genoma: Se completó la secuenciación de chips en el gusano C. elegans para explorar los sitios de unión de 22 factores de transcripción en todo el genoma. Hasta el 20% de los genes candidatos anotados se asignaron a factores de transcripción. Se asignaron varios factores de transcripción a regiones de ARN no codificantes y pueden estar sujetos a variables ambientales o de desarrollo. También se identificaron las funciones de algunos de los factores de transcripción. Algunos de los factores de transcripción regulan genes que controlan otros factores de transcripción. Estos genes no están regulados por otros factores. La mayoría de los factores de transcripción sirven como objetivos y reguladores de otros factores, lo que demuestra una red de regulación. [20]

Inferir red reguladora: Se demostró que la señal de ChIP-seq de la modificación de la histona estaba más correlacionada con los motivos del factor de transcripción en los promotores en comparación con el nivel de ARN. [21] Por lo tanto, el autor propuso que el uso de la modificación de histonas ChIP-seq proporcionaría una inferencia más confiable de redes reguladoras de genes en comparación con otros métodos basados ​​en la expresión.

ChIP-seq ofrece una alternativa a ChIP-chip. Los datos experimentales de STAT1 ChIP-seq tienen un alto grado de similitud con los resultados obtenidos por ChIP-chip para el mismo tipo de experimento, con más del 64% de picos en regiones genómicas compartidas. Debido a que los datos son lecturas de secuencia, ChIP-seq ofrece una línea de análisis rápida siempre que haya una secuencia del genoma de alta calidad disponible para el mapeo de lectura y el genoma no tenga contenido repetitivo que confunda el proceso de mapeo. ChIP-seq también tiene el potencial de detectar mutaciones en las secuencias del sitio de unión, lo que puede respaldar directamente cualquier cambio observado en la unión de proteínas y la regulación de genes.

Al igual que con muchos enfoques de secuenciación de alto rendimiento, ChIP-seq genera conjuntos de datos extremadamente grandes, para los que se requieren métodos de análisis computacional adecuados. Para predecir los sitios de unión al ADN a partir de los datos de recuento de lecturas de ChIP-seq, se han desarrollado métodos de llamada de picos. Uno de los métodos más populares [ cita necesaria ] es MACS que modela empíricamente el tamaño de desplazamiento de las etiquetas ChIP-Seq y lo usa para mejorar la resolución espacial de los sitios de unión predichos. [22] MACS está optimizado para picos de mayor resolución, mientras que otro algoritmo popular, SICER, está programado para solicitar picos más amplios, que abarcan desde kilobases hasta megabases con el fin de buscar dominios de cromatina más amplios. SICER es más útil para las marcas de histonas que abarcan los cuerpos de los genes. Se puede utilizar un método matemático más riguroso BCP (punto de cambio bayesiano) tanto para picos nítidos como anchos con una velocidad computacional más rápida, [23] consulte la comparación de referencia de las herramientas de llamada de picos ChIP-seq de Thomas et. Alabama. (2017). [24]

Otro problema computacional relevante es la llamada diferencial de picos, que identifica diferencias significativas en dos señales ChIP-seq de distintas condiciones biológicas. Los llamadores de picos diferenciales segmentan dos señales ChIP-seq e identifican picos diferenciales utilizando modelos ocultos de Markov. Ejemplos de llamadores de picos diferenciales de dos etapas son ChIPDiff [25] y ODIN. [26]

Para reducir los sitios falsos de ChIP-seq, se pueden usar múltiples controles experimentales para detectar sitios de unión a partir de un experimento de IP. Bay2Ctrls adopta un modelo bayesiano para integrar el control de entrada de ADN para la IP, la IP simulada y su correspondiente control de entrada de ADN para predecir los sitios de unión desde la IP. [27] Este enfoque es particularmente eficaz para muestras complejas, como organismos modelo completos. Además, el análisis indica que, para muestras complejas, los controles de IP simulados superan sustancialmente a los controles de entrada de ADN, probablemente debido a los genomas activos de las muestras. [27]


Descargue e imprima este artículo para su uso personal académico, de investigación y educativo.

Compre una única edición de Ciencias por solo $ 15 USD.

Ciencias

Vol 300, número 5623
23 de mayo de 2003

Herramientas del artículo

Inicie sesión para agregar una alerta para este artículo.

Por Karin Hübner, Guy Fuhrmann, Lane K. Christenson, James Kehler, Rolland Reinbold, Rabindranath De La Fuente, Jennifer Wood, Jerome F. Strauss III, Michele Boiani, Hans R. Schöler

Ciencias 23 de mayo de 2003: 1251-1256


Técnicas de análisis de vanguardia

Control de calidad

Después de demultiplexar códigos de barras y alinear las lecturas adecuadamente recortadas al genoma de referencia apropiado, los datos resultantes de un experimento de scRNA-seq se pueden representar como una matriz entera de niveles de expresión génica, y cada entrada representa el número de lecturas secuenciadas (o moléculas, si Se utilizaron UMI) asignados a un gen particular en una célula específica. En particular, la descomposición del código de barras no es trivial, particularmente para las secuencias aleatorias de UMI, ya que los errores de secuenciación pueden alterar sus secuencias observadas. Se han desarrollado métodos para dar cuenta de esto mediante la predicción de qué códigos de barras han surgido por error y cuáles existieron realmente dentro de la muestra (Smith et al, 2017 ).

Posteriormente, es importante evaluar la calidad del transcriptoma para cada célula: la lisis celular incompleta o las fallas durante la preparación de la biblioteca pueden proporcionar resultados que confunden los análisis. Hay muchos parámetros en los que las pruebas de control de calidad (QC) pueden enfocarse, pero hay tres atributos que pueden evaluarse fácilmente en todos los conjuntos de datos unicelulares: el número total de transcripciones detectadas, el número total de genes que se encuentran expresados ​​y el fracción de expresión aportada por genes mitocondriales. Las células que muestran un comportamiento aberrante para estas características generalmente se eliminan de análisis posteriores, aunque se debe tener cuidado al estudiar una población heterogénea de células, ya que el contenido total de ARNm y otras características pueden variar sustancialmente (Ilicic et al, 2016 ).

El abandono es un fenómeno observado en scRNA-seq por el cual las células que se espera que expresen un determinado gen muestran un recuento observado de cero. Se entiende más comúnmente que esto se debe a fallas estocásticas de las transcripciones para que se transcriban en sentido inverso o se amplifiquen y, por lo tanto, nunca se secuencian. Esto es de particular importancia para los datos generados por ensayos de gotas, donde la eficiencia de captura varía considerablemente entre las células. Para recuperar los valores de expresión de los genes abandonados, es posible imputar valores de expresión de otras células que muestran patrones de expresión similares (preimpresión: Dijk et al, 2017). Sin embargo, el usuario debe asegurarse de que las señales débiles no se inflen artificialmente. Un investigador también debe ser consciente de la posibilidad de que los dobletes puedan generar señales técnicas en un conjunto de datos, particularmente para los métodos basados ​​en gotas. Si bien no existen métodos publicados para la detección de dobletes en el momento de escribir este artículo, varios artículos han implementado enfoques heurísticos para excluir bibliotecas de multipletes. Estos incluyen el rechazo de células que expresan conjuntos de marcadores biológicamente excluyentes entre sí (p. Ej. Xist y genes del cromosoma Y Ibarra-Soria et al, 2017) e identificando pequeños grupos compuestos por células con un gran tamaño de biblioteca cuyos perfiles de expresión se correlacionan fuertemente con al menos otros dos grupos en el conjunto de datos (Bach et al, 2017 ).

Factores confusos

Los experimentos de secuencia de ARN de una sola célula son sensibles a factores de confusión. Por ejemplo, como en cualquier experimento de ómica, las diferencias sistemáticas entre lotes experimentales deben eliminarse antes de poder comparar los perfiles de expresión de las células, enfatizando la importancia de un buen diseño experimental (Lun y Marioni, 2017). Incluso cuando se controlan estos efectos, las verdaderas diferencias biológicas pueden producir señales ortogonales al objetivo del experimento. En particular, el tamaño de la célula (reflejado por el contenido total de ARNm) a menudo se manifiesta en el número de genes detectados en cada célula (McDavid et al, 2016 Hicks et al, 2017), que puede conducir a una estructura en el espacio de expresión de alta dimensión. Las diferencias de tamaño de la biblioteca celular se controlan mediante el paso crítico de normalización (revisado en Vallejos et al (2017)), cuyo objetivo es eliminar las diferencias debidas a la profundidad de secuenciación y al contenido total de ARN. La adición de especies de ARN exógeno cuantificadas con precisión (genes "spike-in") al lisado de cada célula permite la estimación de cantidades absolutas de ARN (Brennecke et al, 2013). Sin embargo, su uso es poco común en los ensayos basados ​​en gotas: el ARN con picos estará presente en cada gota, no solo en las que contienen células. En consecuencia, los genes con picos pueden consumir una gran cantidad del espacio de lectura de secuenciación y se confundirían con el uso repetido del mismo código de barras de la celda en varias gotitas (lo que da como resultado una cantidad variable de picos por código de barras). Otros factores biológicos, como la etapa del ciclo celular, también pueden conducir a una estructura que pueda enmascarar la señal de interés. Existen estrategias computacionales para identificar y eliminar estos efectos (Buettner et al, 2015 ).

Identificación del tipo de celda

Un primer paso común en el análisis de los datos de scRNA-seq es clasificar las células en varios grupos. Al identificar estos subgrupos de células, se puede evaluar el grado de heterogeneidad dentro de la población de interés y se pueden realizar comparaciones, incluso entre grupos de células potencialmente pequeños o raros (por ejemplo, células germinales primordiales).

El rendimiento de la agrupación de tipos de células se puede mejorar utilizando solo genes que varían más entre células de lo que cabría esperar por casualidad (Brennecke et al, 2013), o mediante el uso de "genes propios" que explican la variabilidad en los datos (por ejemplo, derivados a través del análisis de componentes principales). Para obtener más información sobre estas características, consulte Trapnell (2015).

Trayectorias de desarrollo y pseudotiempo

En muchos sistemas, las celdas muestran un espectro continuo de estados que se considera que representan el proceso de diferenciación. En estos casos, una clasificación discreta de celdas no es apropiada y un investigador puede preferir utilizar un método que resuma la continuidad de los estados de celda en los datos.

Estos métodos suelen denominarse pseudotime métodos, término introducido por primera vez por el paquete de software Monocle (Trapnell et al, 2014). Pseudotime describe un orden de las células de acuerdo con alguna característica en los datos, esto puede representar procesos de desarrollo que ocurren a lo largo del tiempo, o los efectos de la heterogeneidad espacial continua en un sistema. Debido a que el pseudotime es un ordenamiento de las células, permite la identificación de los tipos de células en los estados inicial y final de la trayectoria, así como aquellas células en etapas intermedias (Fig 2). A partir del ordenamiento de las células, es posible identificar los cambios transcripcionales que acompañan a los procesos de desarrollo, que también pueden permitir la reconstrucción de redes reguladoras de genes (Moignard et al, 2015). Además, los desarrollos recientes permiten la detección de puntos de ramificación en trayectorias (Haghverdi et al, 2016), que sirven para identificar puntos críticos de la toma de decisiones celular. Tenga en cuenta que se debe tener cuidado al aplicar los métodos de clasificación y pseudotime, ya que se garantiza que generarán resultados independientemente de la calidad de los datos suministrados. Rara vez hay una cuantificación de la incertidumbre y los resultados suelen depender de la elección de parámetros específicos. Para una interpretación adecuada, es importante asegurarse de que los datos de entrada sean de alta calidad y no se confundan, por ejemplo, por efectos de lotes. Además, se debe enfatizar que los datos de “instantánea” estática de scRNA-seq poseen limitaciones intrínsecas para el estudio de procesos dinámicos, que son comunes en toda la biología del desarrollo (preprint: Weinreb et al, 2017 ).

Figura 2. Pseudotime recapitula las trayectorias de desarrollo


Células madre embrionarias

Las células madre embrionarias (ESC) son células madre derivadas de las células de masa interna indiferenciadas de un embrión humano.

Las células madre embrionarias son pluripotentes, lo que significa que pueden crecer (es decir, diferenciarse) en todos los derivados de las tres capas germinales primarias: ectodermo, endodermo y mesodermo.

En otras palabras, pueden convertirse en cada uno de los más de 200 tipos de células del cuerpo adulto siempre que se especifique que lo hagan.

Las células madre embrionarias se distinguen por dos propiedades distintivas: su pluripotencia y su capacidad para replicarse indefinidamente.

Las células madre embrionarias son pluripotentes, es decir, pueden diferenciarse en todos los derivados de las tres capas germinales primarias: ectodermo, endodermo y mesodermo.

Estos incluyen cada uno de los más de 220 tipos de células del cuerpo adulto.

La pluripotencia distingue las células madre embrionarias de las células madre adultas que se encuentran en adultos, mientras que las células madre embrionarias pueden generar todos los tipos de células en el cuerpo, las células madre adultas son multipotentes y pueden producir solo un número limitado de tipos de células.

Además, en condiciones definidas, las células madre embrionarias son capaces de propagarse indefinidamente.

Esto permite que las células madre embrionarias se empleen como herramientas útiles tanto para la investigación como para la medicina regenerativa, porque pueden producir un número ilimitado de ellas mismas para la investigación continua o el uso clínico.

Debido a su plasticidad y su capacidad potencialmente ilimitada de autorrenovación, se han propuesto terapias con células madre embrionarias para la medicina regenerativa y el reemplazo de tejidos después de una lesión o enfermedad.

Las enfermedades que potencialmente podrían ser tratadas por células madre pluripotentes incluyen una serie de enfermedades genéticas, cánceres y trastornos relacionados con la sangre y el sistema inmunológico diabetes juvenil

Ceguera de Parkinson y lesiones de la médula espinal.

Además de las preocupaciones éticas de la terapia con células madre, existe un problema técnico de la enfermedad de injerto contra huésped asociada con el trasplante alogénico de células madre.

Sin embargo, estos problemas asociados con la histocompatibilidad pueden resolverse utilizando células madre adultas de donantes autólogos, clonación terapéutica, bancos de células madre o, más recientemente, reprogramando células somáticas con factores definidos (por ejemplo, células madre pluripotentes inducidas).

Otros usos potenciales de las células madre embrionarias incluyen la investigación del desarrollo humano temprano, el estudio de enfermedades genéticas y como sistemas in vitro para pruebas de toxicología.


Hematopoyesis embrionaria temprana fuera de la región AGM

Placenta: ¿fuente o reservorio?

Aunque se sabe que la placenta fetal alberga dHSC (Dancis et al., 1977 Dancis et al., 1968), la posibilidad de que la placenta esté colonizada por HSC del hígado fetal oscurece la importancia de este hallazgo. La porción coriónica de la placenta del ratón expresa Runx1 desde una etapa temprana de desarrollo (Fig. 1A), y cuando se aísla antes de la fusión con la alantoides puede generar células hematopoyéticas en cultivo (Zeigler et al., 2006). La placenta de ratón E8.0-9.0 contiene muchos progenitores hematopoyéticos, incluyendo HPP-CFC reemplazable (ver Glosario, Cuadro 1) (Alvarez-Silva et al., 2003). Como muestra el trasplante, las dHSC aparecen en la placenta concomitantemente con la región AGM por E10.5-11.0 (Gekas et al., 2005 Ottersbach y Dzierzak, 2005). En paralelo con la actividad de AGM, la placenta desarrolla rápidamente una reserva sustancial de dHSC (13-50 dHSC por E12.5), que disminuye en E15.5, lo que sugiere que las dHSC se traslocan al hígado (Gekas et al., 2005 Ottersbach y Dzierzak, 2005). La placenta humana también es un nicho para las dHSC (Robin et al., 2009).

La hematopoyesis del pez cebra ocurre en cuatro ondas secuenciales. (A) Un embrión de pez cebra de 14 horas después de la fertilización (hpf) visto desde arriba (izquierda) y en una vista en sección transversal (derecha), que muestra franjas laterales del mesodermo lateral posterior (PLM) que formarán la aorta dorsal, la vena cardinal, las células sanguíneas y el pronefros y sus conductos después de su migración hacia la línea media. Las flechas curvas muestran las dos franjas PLM migrando hacia la línea media. (B) Un embrión de pez cebra de 18 hpf visto desde el lado con el dorsal superior (izquierda) y en sección transversal (derecha). En esta etapa, la onda de precursores mieloides (pu.1 + / Scl +), que se originan en el mesodermo lateral anterior, migran lateralmente a través del saco vitelino y maduran en macrófagos y granulocitos (ver onda 1, W1). La migración de las franjas PLM hacia la línea media (indicada por dos flechas negras convergentes en B, derecha) da como resultado la diferenciación de las células eritroides embrionarias (indicadas con un sombreado naranja pálido) debajo del cordón angioblástico aórtico dorsal (mostrado en rosa) en forma de onda. 2 (W2). (C) Un embrión de pez cebra de 26 hpf con una vista en sección transversal que se muestra a la derecha. En esta etapa, aparecen progenitores eritromieloides que carecen de potencial de diferenciación linfoide en el tejido hematopoyético caudal (también llamado isla de sangre posterior y plexo de la vena caudal). Estos progenitores colonizan el pronefros pero no el timo (onda 3, W3). A W3 le sigue la aparición de MPP / HSC desde el suelo de la aorta dorsal (onda 4, W4). La formación de MPP y HSC ocurre a través de un proceso llamado transición endotelial-hematopoyética: la célula endotelial alargada (marcada en verde) comienza a expresar Runx1, c-Myb, CD41, se dobla y se vuelve redonda. Luego migra a través de la capa mesenquimatosa y entra en la vena cardinal (flecha curva delgada). A través de la circulación, las células madre hematopoyéticas colonizan órganos con actividad hematopoyética adulta (pronefros y timo), que se muestran mediante flechas rectas en negrita. La dirección de la circulación se muestra mediante flechas delgadas dentro de los vasos. HSC, MPP de células madre hematopoyéticas, progenitor multipotente.

La hematopoyesis del pez cebra ocurre en cuatro ondas secuenciales. (A) Un embrión de pez cebra de 14 horas después de la fertilización (hpf) visto desde arriba (izquierda) y en una vista en sección transversal (derecha), que muestra franjas laterales del mesodermo lateral posterior (PLM) que formarán la aorta dorsal, la vena cardinal, las células sanguíneas y el pronefros y sus conductos después de su migración hacia la línea media. Las flechas curvas muestran las dos franjas PLM migrando hacia la línea media. (B) Un embrión de pez cebra de 18 hpf visto desde el lado con el dorsal más arriba (izquierda) y en una vista en sección transversal (derecha). En esta etapa, la onda de precursores mieloides (pu.1 + / Scl +), que se originan en el mesodermo lateral anterior, migran lateralmente a través del saco vitelino y maduran en macrófagos y granulocitos (ver onda 1, W1). La migración de las franjas PLM hacia la línea media (indicada por dos flechas negras convergentes en B, derecha) da como resultado la diferenciación de las células eritroides embrionarias (indicadas con un sombreado naranja pálido) debajo del cordón angioblástico aórtico dorsal (mostrado en rosa) en forma de onda. 2 (W2). (C) Un embrión de pez cebra de 26 hpf con una vista en sección transversal que se muestra a la derecha. En esta etapa, aparecen progenitores eritromieloides que carecen de potencial de diferenciación linfoide en el tejido hematopoyético caudal (también llamado isla de sangre posterior y plexo de la vena caudal). Estos progenitores colonizan el pronefros pero no el timo (onda 3, W3). A W3 le sigue la aparición de MPP / HSC desde el suelo de la aorta dorsal (onda 4, W4). La formación de MPP y HSC ocurre a través de un proceso llamado transición endotelial-hematopoyética: la célula endotelial alargada (marcada en verde) comienza a expresar Runx1, c-Myb, CD41, se dobla y se vuelve redonda. Luego migra a través de la capa mesenquimatosa y entra en la vena cardinal (flecha curva delgada). A través de la circulación, las células madre hematopoyéticas colonizan órganos con actividad hematopoyética adulta (pronefros y timo), que se muestran mediante flechas rectas en negrita. La dirección de la circulación se muestra mediante flechas delgadas dentro de los vasos. HSC, MPP de células madre hematopoyéticas, progenitor multipotente.

En la placenta del Ncx1-rratón nulo (Ncx1 codifica una membrana intercambiadora de sodio-calcio también conocida como Slc8a1 - Mouse Genome Informatics) un sistema circulatorio activo está ausente debido a la insuficiencia cardíaca. Sin embargo, todavía se forman grupos de células hematopoyéticas similares a los grupos intraaórticos, y se propuso que la placenta genera dHSC de forma autónoma (Rhodes et al., 2008). Ncx1 - / - las placentas pueden generar células linfoides, sin embargo, los intentos de confirmar la generación autónoma de dHSC en cultivos de explantes de placenta de tipo salvaje no han tenido éxito (Robin et al., 2006). Si la placenta inicia el desarrollo de dHSC o solo apoya la maduración de dHSC exógenas requiere más investigación.

Cordón umbilical: ¿cuál es su potencia dHSC?

El cordón umbilical de los mamíferos se deriva en gran medida de la alantoides, que después de la gastrulación invade la cavidad exocelómica, alcanza el cono ectoplacentario y forma la fusión corioalantoidea que contribuye a la placenta (Downs, 2002). Although the avian allantois is hematopoietically active (Caprioli et al., 1998), whether the mouse allantois is has been questioned (Downs et al., 1998). However, Runx1 was detected in the mouse allantois prior to fusion with the ectoplacental cone (Fig. 1A) and its hematopoietic potential was unveiled in culture (Corbel et al., 2007 Zeigler et al., 2006).

The mouse umbilical vessels develop Runx1-positive cell clusters similar to those observed in the dorsal aorta (Liakhovitskaia et al., 2009 North et al., 1999), and at E10.5 contain rare dHSC at frequencies comparable with the AGM region at this stage (

1 dHSC per 30 embryos) (de Bruijn et al., 2000b). As explant cultures of the umbilical cord fail to generate dHSC, the contribution of the allantois/umbilical cord to adult hematopoiesis remains unknown.

DHSC generation: does the yolk sac have an active role?

E9.0-10.0 yolk sac cells can mature into dHSCs in newborn animals and can subsequently provide long-term contribution to adult hematopoiesis (Yoder et al., 1997a Yoder et al., 1997b). Similar results have been achieved by the transplantation of E9.0 yolk sac cells into the embryo in utero (Toles et al., 1989). These cells are more numerous in the yolk sac than in the body and are CD34 + cKit + (Yoder et al., 1997a). CD34 + cKit + cells purified from the E10.5 AGM region can develop in culture into cells that can repopulate adult Rag2γc −/− at low levels (Bertrandet et al., 2005). What is the origin of these cells: the P-Sp or the yolk sac? The answer to this is not clear as these cells are not functionally detectable in younger E8.0 embryos. Earlier reports indicated that E8.0 yolk sac cells when injected transplacentally can mature and contribute to adult hematopoiesis (Weissman et al., 1977). However, the primary origin of these cells (yolk sac or P-Sp) remains unclear. An attempt to determine the contribution of the yolk sac to adult hematopoiesis has been made using induced genetic labeling of Runx1 + cells (Samokhvalov et al., 2007). However, owing to the unclear duration of labeling, the presence of Runx1-expressing cells outside of the yolk sac and the very low contribution of labeled cells to adult hematopoiesis, it is difficult to draw firm conclusions from this study.

Possible mechanisms of intra-aortic cluster formation. (A) A dissected E11.5 mouse AGM region, showing the dorsal aorta (Ao) and urogenital ridges (UGR). (B) Transverse section of E11.5 AGM region, showing the Ao and an intra-aortic cluster that is triple-positive for Pecam-1, CD45 and c-kit (magnified in the insert). Note the indentation (arrow), which suggests that active invagination of the endothelial layer is associated with cluster formation. Asterisk indicates intra-aortic cluster. CV, caudal vein. (C) A schematic cross-section of the ventral floor of a mouse Ao showing four possible origins of dHSCs. (a) An endothelial precursor gives rise to endothelial cells (blue), some of which become hematogenic and give rise to the definitive hematopoietic stem cells (dHSCs, pink) and more differentiated hematopoietic cells. A Pre-dHSC intermediate (purple) between the hematogenic endothelial cell and dHSC is shown integrated into the endothelial layer. (B) A hemangioblast (purple) gives rise separately to the dHSC and to non-hematopoietic (structural) endothelial cells. A pre-HSC intermediate may be integrated into the endothelial lining but in fact is not an endothelial cell. (C) Sub-endothelial pre-dHSC of non-endothelial origin matures into a dHSC. It is a fully hematopoietically committed cell and, in contrast to hemangioblasts, pre-HSCs do not generate endothelial cells. (D) A migrant pre-dHSC of non-endothelial origin arrives through circulation and integrates into the endothelial lining.

Possible mechanisms of intra-aortic cluster formation. (A) A dissected E11.5 mouse AGM region, showing the dorsal aorta (Ao) and urogenital ridges (UGR). (B) Transverse section of E11.5 AGM region, showing the Ao and an intra-aortic cluster that is triple-positive for Pecam-1, CD45 and c-kit (magnified in the insert). Note the indentation (arrow), which suggests that active invagination of the endothelial layer is associated with cluster formation. Asterisk indicates intra-aortic cluster. CV, caudal vein. (C) A schematic cross-section of the ventral floor of a mouse Ao showing four possible origins of dHSCs. (a) An endothelial precursor gives rise to endothelial cells (blue), some of which become hematogenic and give rise to the definitive hematopoietic stem cells (dHSCs, pink) and more differentiated hematopoietic cells. A Pre-dHSC intermediate (purple) between the hematogenic endothelial cell and dHSC is shown integrated into the endothelial layer. (B) A hemangioblast (purple) gives rise separately to the dHSC and to non-hematopoietic (structural) endothelial cells. A pre-HSC intermediate may be integrated into the endothelial lining but in fact is not an endothelial cell. (C) Sub-endothelial pre-dHSC of non-endothelial origin matures into a dHSC. It is a fully hematopoietically committed cell and, in contrast to hemangioblasts, pre-HSCs do not generate endothelial cells. (D) A migrant pre-dHSC of non-endothelial origin arrives through circulation and integrates into the endothelial lining.

Although the pre-circulatory E8.0 mouse yolk sac is restricted to generating short-lived myeloid progeny (Cumano et al., 2001), by E11.5 it contains true multilineage dHSCs. Furthermore, by E12.5, when the expansion of dHSCs in the AGM has significantly diminished, the yolk sac acquires the capacity to expand dHSCs in culture (Kumaravelu et al., 2002). Although it is possible that the E12.5 yolk sac microenvironment becomes competent to expand dHSCs of exogenous origins, the initiation of dHSCs de novo by the yolk sac cannot be ruled out. dHSCs in heterozygous Runx1 +/− embryos develop prematurely in the yolk sac by E10.5, indicating that this location, in principle, is not prohibitive for dHSC development (Cai et al., 2000).

Different sites of hematopoietic activity in the embryo are linked by the circulation, but is the role of the circulation in hematopoiesis only to facilitate cell trafficking? We discuss this further below.


IPSCs

Although pluripotency can occur naturally only in embryonic stem cells, it is possible to induce terminally differentiated cells to become pluripotent again. The process of direct reprogramming converts differentiated somatic cells into iPSC lines that can form all cell types of an organism. Reprogramming focuses on the expression of oncogenes such as Myc and Klf4 (Kruppel-like factor 4). This process is enhanced by a downregulation of genes promoting genome stability, such as p53. Additionally, cell reprogramming involves histone alteration. All these processes can cause potential mutagenic risk and later lead to an increased number of mutations. Quinlan et al. [40] checked fully pluripotent mouse iPSCs using whole genome DNA sequencing and structural variation (SV) detection algorithms. Based on those studies, it was confirmed that although there were single mutations in the non-genetic region, there were non-retrotransposon insertions. This led to the conclusion that current reprogramming methods can produce fully pluripotent iPSCs without severe genomic alterations.

During the course of development from pluripotent hESCs to differentiated somatic cells, crucial changes appear in the epigenetic structure of these cells. There is a restriction or permission of the transcription of genes relevant to each cell type. When somatic cells are being reprogrammed using transcription factors, all the epigenetic architecture has to be reconditioned to achieve iPSCs with pluripotency [41]. However, cells of each tissue undergo specific somatic genomic methylation. This influences transcription, which can further cause alterations in induced pluripotency [42].

Source of iPSCs

Because pluripotent cells can propagate indefinitely and differentiate into any kind of cell, they can be an unlimited source, either for replacing lost or diseased tissues. iPSCs bypass the need for embryos in stem cell therapy. Because they are made from the patient’s own cells, they are autologous and no longer generate any risk of immune rejection.

At first, fibroblasts were used as a source of iPSCs. Because a biopsy was needed to achieve these types of cells, the technique underwent further research. Researchers investigated whether more accessible cells could be used in the method. Further, other cells were used in the process: peripheral blood cells, keratinocytes, and renal epithelial cells found in urine. An alternative strategy to stem cell transplantation can be stimulating a patient’s endogenous stem cells to divide or differentiate, occurring naturally when skin wounds are healing. In 2008, pancreatic exocrine cells were shown to be reprogrammed to functional, insulin-producing beta cells [43].

The best stem cell source appears to be the fibroblasts, which is more tempting in the case of logistics since its stimulation can be fast and better controlled [44].

Teratoma formation assay

The self-renewal and differentiation capabilities of iPSCs have gained significant interest and attention in regenerative medicine sciences. To study their abilities, a quality-control assay is needed, of which one of the most important is the teratoma formation assay. Teratomas are benign tumours. Teratomas are capable of rapid growth in vivo and are characteristic because of their ability to develop into tissues of all three germ layers simultaneously. Because of the high pluripotency of teratomas, this formation assay is considered an assessment of iPSC’s abilities [45].

Teratoma formation rate, for instance, was observed to be elevated in human iPSCs compared to that in hESCs [46]. This difference may be connected to different differentiation methods and cell origins. Most commonly, the teratoma assay involves an injection of examined iPSCs subcutaneously or under the testis or kidney capsule in mice, which are immune-deficient [47]. After injection, an immature but recognizable tissue can be observed, such as the kidney tubules, bone, cartilage, or neuroepithelium [30]. The injection site may have an impact on the efficiency of teratoma formation [48].

There are three groups of markers used in this assay to differentiate the cells of germ layers. For endodermal tissue, there is insulin/C-peptide and alpha-1 antitrypsin [49]. For the mesoderm, derivatives can be used, e.g. cartilage matrix protein for the bone and alcian blue for the cartilage. As ectodermal markers, class III B botulin or keratin can be used for keratinocytes.

Teratoma formation assays are considered the gold standard for demonstrating the pluripotency of human iPSCs, demonstrating their possibilities under physiological conditions. Due to their actual tissue formation, they could be used for the characterization of many cell lineages [50].


Métodos

Oversight.

Animals.

All procedures with mice followed the recommendations and approval of the Institutional Animal Care and Use Committee of the University of Washington and were performed within an American Association for the Advancement of Laboratory Animal Care-accredited specific pathogen-free facility at the University of Washington.

Human subjects.

Approval was received from the University of Washington Institutional Review Board to obtain consent for donation of excess cryopreserved human embryos from fertility clinic patients to generate new human ESC lines. All embryo donations followed informed consent.

Embryonic stem cell research oversight.

All embryonic stem cell work was preapproved by the University of Washington Embryonic Stem Cell Research Oversight Committee.

Cell Line Nomenclature.

Cell line name “p” + number: total passage number

L: leukemia inhibitory factor

B/S: butyrate + SAHA HDACi mixture

2i: PD0325901 (MEK inhibitor) + CHIR99021 (GSK3 inhibitor)

3i: 2i + SU5402 (FGFR inhibitor)

Parentheses: previous factor exposure

to the right of parentheses: current factor exposure

associated numbers: number of passages under those conditions

For example, H1p52(B/S3)2iF10 indicates H1 cultured for a total of 52 passages. Cells were exposed to butyrate + SAHA for three passages from p40–p42 and then to 2i + FGF for 10 passages from p43 to p52.

Culture of Pluripotent Cells.

Initial cultures of hESC [H1 (NIH code WA01), H7 (NIH code WA07), H9 (NIH code WA09), BG02, and HUES2], nonhuman primate M. fascicularis (MF-1), mEpiSC5, and mEpiSC7 ES cells were grown on a feeder layer of gamma-irradiated (3,000 Rad) primary mouse embryonic fibroblasts (MEFs) (7, 25). For cultures without feeders, cells were plated on Matrigel (BD Biosciences) diluted according to the manufacturer’s instructions. Cultures were incubated at 37 °C in 5% C02, 5% O2, and 90% N2. hESC culture medium consisted of high-glucose DMEM/F12 containing GlutaMax supplemented with 20% KnockOut serum replacer (SR), 1 mM sodium pyruvate, 0.1 mM nonessential amino acids, 50 U/mL penicillin, 50 mg/mL streptomycin (all from Invitrogen), and 0.1 mM β-mercaptoethanol (Sigma–Aldrich). To reverse toggle, hESCs were first cultured in the presence of an HDACi mixture containing 0.1 mM sodium butyrate (Sigma–Aldrich) plus 50 nM SAHA (B/S Cayman). Human LIF was used when LIF is specified for human and nonhuman primate ESCs. Factors were used at the following concentrations: 10 ng/mL hLIF (Chemicon), 10 ng/mL Activin A (Humanzyme), 10 ng/mL FGF2 (Invitrogen), 0.4–0.8 μM PD0325901 (Selleck), 1.0–3.0 μM CHIR99021 (Selleck), 2 μM SU5402 (Calbiochem), 0.1 μM NSC74859 (Selleck), and 10 μM Y-27632 (Selleck). Primed cells and human cells in B/S were exposed to 1.2 U/mL dispase (Invitrogen) dissolved in PBS supplemented with SR. Naïve cells and mouse cells in B/S were passaged using trypsin/EDTA (Invitrogen).

mESCs were cultured in either DMEM or DMEM/F12 with the additives described above, except the serum replacer was substituted with 20% FBS (ES qualified Invitrogen), unless otherwise stated. MEF-free cultures were grown on Matrigel- coated dishes using medium supplemented as indicated in the text. Mouse LIF was used at 1,000 units/mL for mESCs (ESGRO Chemicon).

Cells for undirected differentiation were seeded at ∼2 × 10 5 cells per uncoated, gelatinized, or Matrigel-treated 10-cm plate in DMEM (Invitrogen) containing 20% FBS (ES cell tested Invitrogen) with penicillin and streptomycin (Invitrogen). Cells were allowed to attach and fluid was changed every other day.

Establishment of Elf1.

Elf1 was thawed as a six- to eight-cell embryo, cultured to expanded blastocyst in blastocyst medium (Sage), and kept in a 5% CO2, 5% O2 atmosphere throughout. Four days after thaw, the zona pellucida was removed using Acidified Tyrode’s Solution and the zona-free embryo plated into one well of a 96-well plate seeded with feeders. The first passage was mechanical 3 d following the removal of the zona. Seven days later, passage was through mechanical plucking of a growth above the plated colony. Subsequent passages used Trypsin/EDTA. The culture seemed established by passage 5. Henceforth, the cells were passaged two times per week using trypsin/EDTA. Elf1 was bulk-frozen at passage 8 in hESC culture medium plus 10–12 ng/mL FGF2, 3 μM CHIR 99021, and 0.4 μM PD0329501 (2iF) using the cryoprotectant dimethylsufloxide (10% Sigma) and given the name Elf1, “El” to honor the Ellisons, who donated the funds for the work, and “f1” for female, line one. Elf1 is on the NIH Stem Cell Registry (0156 approved May 15, 2012) and is being banked at WiCell for distribution.

Microarray Analysis.

Whole mouse and whole human genome arrays (Agilent) were hybridized with total RNA from ESCs cultured with additives as indicated in the text. These were run in independent quadruplicate through the array facility at Seattle Biomedical Research Institute.

Microarray Data Preprocessing.

The data for each experiment were stored as raw, preprocessed, and processed in Synapse Commons Repository (https://synapse.sagebase.org/). With the exception of the Hunter et al. study (8) (GSE8881), we implemented the default one-color Affymetrix and default two-color Agilent workflows for each dataset. The former removes intensity-dependent array effects, and the latter removes both intensity-dependent array and dye effects. A single study, the Elf1 dataset, required a more sophisticated model, which in this case meant correcting for the effects of an outlier sample. Further methods are defined in información de soporte.

Immunohistochemistry.

Triple immunofluorescent labeling to detect endoderm in teratoma sections was performed as previously published with minor modifications (26). Methods are further defined in información de soporte.

Further methods for array analysis, immunohistochemistry, flow cytometry, quantitative PCR, XIST FISH, bisulfite sequencing, teratoma formation, karyotype analysis, and electron microscopy can be found in información de soporte.


Resultados

ITGA6 and EPCAM can be used to isolate human PGCs from embryonic ovaries but not embryonic testes

Recently, in vitro human PGCLCs were isolated using INTEGRINα6 (ITGA6) and EPCAM following hiPSC differentiation [ 19] however, whether ITGA6/EPCAM can be used to isolate in vivo PGCs from human embryos has not been shown. To address this, we examined cells from a pair of human embryonic ovaries at 72 day postfertilization by staining with four antibodies that detect ITGA6, EPCAM, TNAP, and cKIT. cKIT and TNAP were used as a positive control, given that these surface proteins can be used to sort human PGCs from the prenatal embryonic ovary and testis [ 25, 29]. The labeled cells were divided in two and sorted by FACS gating on either ITGA6/EPCAM or TNAP/cKIT (Figure 1A). We discovered that the percentage of ITGA6/EPCAM double positive cells and TNAP/cKIT double positive cells in the embryonic ovary was comparable (Figure 1A). Furthermore, the ITGA6/EPCAM double positive population was also double positive for TNAP/cKIT. Conversely, the TNAP/cKIT double positive cells were also double positive for ITGA6/EPCAM (Figure 1A). Using real-time PCR, we show that both populations expressed PGC genes at equivalent levels (Figure 1B). We repeated this experiment with a pair of human embryonic ovaries at 94 day, and found a similar result (Figure 1A and B). Therefore, these observations indicate that ITGA6/EPCAM can be used to isolate TNAP/cKIT positive germ cells from the human embryonic ovary and vice versa.

Analysis of ITGA6/EPCAM and TNAP/cKIT populations in human prenatal gonads. (A) Flow cytometry of prenatal ovaries at day (d) 72 and 94 postfertilization stained with antibodies that recognize ITGA6, EPCAM, TNAP, and cKIT. (B) Gene expression of the sorted populations from (A, 72d) by real-time PCR. Expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in female hESC line UCLA1 (passage 17 (p17) and p18), which was given a value of 1.0. (C) Flow cytometry of prenatal testis at day 85 and 104 postfertilization stained with ITGA6, EPCAM, TNAP, and cKIT. (D) Gene expression of the sorted populations from (C, 85d) by real-time PCR. For each gene examined, its expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in male hESC line UCLA2 (p11 and p12), which was given a value of 1.0. (E) Unsupervised hierarchical clustering (UHC) of transcriptomes of female hESC line UCLA1 (two biological replicates, p14 and p15), male hESC line UCLA2 (two biological replicates, p13 and p14), TNAP/cKIT positive germ cells from embryonic day 59 testes, ITGA6/EPCAM positive cells from 89d, 103d, and another 89d embryonic ovary. TNAP/cKIT positive cells from 89d ovaries. Asterisk in E–G indicates that the two RNA-seq libraries were made from the same pair of ovaries but sorted with different surface markers. (F) PCA of transcriptomes shown in E. (G) Scatter plot of two transcriptomes made from the same pair of ovaries but sorted with ITGA6/EPCAM (x-axis) and TNAP/cKIT (y-axis).

Analysis of ITGA6/EPCAM and TNAP/cKIT populations in human prenatal gonads. (A) Flow cytometry of prenatal ovaries at day (d) 72 and 94 postfertilization stained with antibodies that recognize ITGA6, EPCAM, TNAP, and cKIT. (B) Gene expression of the sorted populations from (A, 72d) by real-time PCR. Expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in female hESC line UCLA1 (passage 17 (p17) and p18), which was given a value of 1.0. (C) Flow cytometry of prenatal testis at day 85 and 104 postfertilization stained with ITGA6, EPCAM, TNAP, and cKIT. (D) Gene expression of the sorted populations from (C, 85d) by real-time PCR. For each gene examined, its expression is normalized to the GAPDH. Fold change is calculated relative to expression levels of each gene in male hESC line UCLA2 (p11 and p12), which was given a value of 1.0. (E) Unsupervised hierarchical clustering (UHC) of transcriptomes of female hESC line UCLA1 (two biological replicates, p14 and p15), male hESC line UCLA2 (two biological replicates, p13 and p14), TNAP/cKIT positive germ cells from embryonic day 59 testes, ITGA6/EPCAM positive cells from 89d, 103d, and another 89d embryonic ovary. TNAP/cKIT positive cells from 89d ovaries. Asterisk in E–G indicates that the two RNA-seq libraries were made from the same pair of ovaries but sorted with different surface markers. (F) PCA of transcriptomes shown in E. (G) Scatter plot of two transcriptomes made from the same pair of ovaries but sorted with ITGA6/EPCAM (x-axis) and TNAP/cKIT (y-axis).

Next, we performed the same analysis using embryonic testes. Unlike the ovary, we discovered that most ITGA6/EPCAM double positive cells are negative for TNAP/cKIT (Figure 1C), and the ITGA6/EPCAM double positive cells have reduced levels of PGC genes relative to the TNAP/cKIT double positive population (Figure 1D). Given that ITGA6 and EPCAM are epithelial markers [ 30, 31], and PGCs in the embryonic testis are known to be enclosed within epithelial cords [ 25], we reasoned that ITGA6 and EPCAM double positive cells are a mixture of both germ cells and somatic cells in prenatal testis. To test this, we performed immunofluorescence and real-time PCR and show that ITGA6 and EPCAM are expressed by both PGCs and epithelial Sertoli cells (Figure S1A and B), and the ITGA6/EPCAM double positive population is also enriched in Sertoli cell genes SOX9 y AMH (Figure 1D). Therefore, using prenatal tissues containing PGCs, TNAP/cKIT can be used to sort PGCs from both the embryonic ovary and testis, whereas ITGA6/EPCAM can only be used to sort PGCs from the embryonic ovary.

Next, we performed RNA-seq on sorted ITGA6/EPCAM female PGCs at 89 and 103 day (Figure 1E and F), and compared this to a third sample involving a pair of ovaries collected at 89 d, which were pooled and then stained and sorted separately for ITGA6/EPCAM or TNAP/cKIT (Figure 1E–G, marked by asterisk). We also included a testis at 59 day, which was sorted only using TNAP/cKIT to specifically isolate the male PGCs. Using unsupervised hierarchical clustering (UHC), the sorted PGC samples clustered together forming a distinct group relative to an undifferentiated female hESC line (UCLA1), and a male hESC line (UCLA2) (Figure 1E). Evaluation of candidate genes revealed that all putative PGC samples expressed the early and late stage PGC genes and have acquired a naïve pluripotent signature (Figure S1C). Moreover, the ITGA6/EPCAM and TNAP/cKIT PGCs sorted from the same pair of 89 day embryonic ovaries clustered the closest compared to ITGA6/EPCAM populations sorted from different ovaries (Figure 1E). This result further supports the conclusion that ITGA6/EPCAM and TNAP/cKIT are expressed on the same population of PGCs. To better display the similarities and differences between samples, we performed PCA, and found that the PGCs are well separated from undifferentiated hESCs along the PC1 axis, while the 59-day male TNAP/cKIT PGCs are separated from the other gonadal PGCs along the PC2 axis (Figure 1F). This separation is anticipated to be caused by the 4-week difference in age between male and female samples in this study, as well as gender [ 32]. Last, we examined the differentially expressed genes (DEGs) between ITGA6/EPCAM and TNAP/cKIT positive cells sorted from the same ovary pair and found very few DEGs as the two transcriptomes are highly correlated with linear regression R squared = 0.98 (Figure 1G). Therefore, we propose that ITGA6/EPCAM and TNAP/cKIT are coexpressed on the same cell population in the embryonic ovary.

Germline competency is associated with the induction of genes required for primitive streak formation

Prior to examining PGCLC differentiation across 18 independently derived UCLA hESC lines with ITGA6/EPCAM/TNAP/cKIT, we first piloted the sorting strategy on the male hESC line UCLA2. We discovered that all ITGA6/EPCAM double positive putative PGCLCs at day 4 of differentiation were positive for TNAP however, cKIT was not detected on the PGCLC population (Figure S2A). In mice, cKIT is critical for PGC survival, migration, and proliferation [ 33– 35]. In humans, cKIT is present on PGCs from at least week 4 to week 20 of prenatal life postfertilization [ 25, 29, 32, 36]. Furthermore, analysis of cyno PGCs during gastrulation reveals that cKIT RNA is expressed by PGCs at the time of specification [ 3]. Thus, we reasoned that cKIT is either not translated in early stage human PGCs, or alternatively the conditions for PGCLC induction must be optimized to enable cKIT expression on the cell surface. Given that cKIT is subject to ligand induced endocytosis [ 37], we removed the ligand SCF from the PGCLC media, and this resulted in ITGA6/EPCAM/TNAP/cKIT positive PGCLCs (Figure S2B and D). To determine if excluding SCF affects germ cell identity, we performed real-time PCR and RNA-Seq of the putative ITGA6/EPCAM positive PGCLCs differentiated with or without SCF (Figure S2C and E). To determine the molecular similarity of PGCLCs generated in primed conditions on MEFs, to those generated from hESCs cultured in 4i on MEFs [ 12], we differentiated the WIS2 hESC line for 4 days according to the methods of Irie et al. [ 12] and sorted the TNAP/NANOS3-mCherry PGCLC population. RNA-seq analysis showed that PGCLCs generated from either the primed or 4i cultured hESCs clustered together, and were distinct from the undifferentiated hESCs (Figure S2E and F), indicating that the starting culture media (4i on MEFs versus primed media on MEFs) ultimately yielded PGCLCs with similar transcriptional identities.

Using ITGA6/EPCAM as a sorting approach to analyze PGCLCs, we next examined PGCLC competency of 18 hESC lines, all derived at UCLA from 18 single frozen embryos (Figure 2A). All hESC lines were capable of teratoma formation when injected into severe combined immunocompromized (SCID) beige mice (UCLA1–6 [ 22] UCLA8–10, UCLA14, UCLA16–18 [ 23] and this study UCLA7, UCLA11–13, and UCLA15: Figure S3A–C). Seventeen out of eighteen hESC lines are karyotypically normal, while UCLA7 has a duplication of chromosome 13 in 100% of cells karyotyped (Figure S3B). We included this cell line in the analysis to determine whether aneuploidy may be associated with alterations in PGCLC potential. It has been previously reported that PGCLC induction efficiency is variable between experiments [ 12, 19]. In order to minimize variability, we induced PGCLCs from 18 hESC lines simultaneously and repeated this experiment four times to determine the average PGCLC induction efficiency for all 18 lines. All 18 independently derived hESC lines were germline competent. However, UCLA6 consistently exhibited the highest germline potential generating on average 35% PGCLCs at day 4 of aggregate formation, whereas UCLA9 had the lowest germline potential generating on average less than 1% PGCLCs at day 4 (Figure 2A Figure S3D). The aneuploid UCLA7 female hESC line generated a comparable percentage of PGCLCs to the other female hESC lines in the data set. Meanwhile, we found that male hESC lines on average were more competent for PGCLC induction than female (Figure 2B).

Germline competency varies between independent hESC lines. (A) Average PGCLC induction efficiency at day 4 in aggregates generated from 18 hESC lines (passage numbers ranging from p10 to p22, see experimental procedures for details). Blue represents male and pink represents female. “a*” indicates the significant difference between UCLA6 and all other cell lines and “b*” indicates the significant difference between UCLA2 and UCLA9 (tested by ANOVA, PAG & lt 0,0001). PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Comparison of day 4 PGCLC induction efficiency from male (blue) and female (pink) hESC lines. “ * ” indicates the difference between male and female (t-test, PAG & lt 0,05). (C) Heat map showing the expression of genes in iMeLCs that positively correlated with PGCLC induction efficiency. Genes are selected as maximal expression <= 2 (RPKM) in hESCs, maximal expression >= 2 (RPKM) in iMeLCs, and correlation coefficient >0.45.

Germline competency varies between independent hESC lines. (A) Average PGCLC induction efficiency at day 4 in aggregates generated from 18 hESC lines (passage numbers ranging from p10 to p22, see experimental procedures for details). Blue represents male and pink represents female. “a*” indicates the significant difference between UCLA6 and all other cell lines and “b*” indicates the significant difference between UCLA2 and UCLA9 (tested by ANOVA, PAG & lt 0,0001). PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Comparison of day 4 PGCLC induction efficiency from male (blue) and female (pink) hESC lines. “ * ” indicates the difference between male and female (t-test, PAG & lt 0,05). (C) Heat map showing the expression of genes in iMeLCs that positively correlated with PGCLC induction efficiency. Genes are selected as maximal expression <= 2 (RPKM) in hESCs, maximal expression >= 2 (RPKM) in iMeLCs, and correlation coefficient >0.45.

In a recent study using nine hiPSC lines, it was determined that primitive streak genes were associated with PGCLC competency [ 21]. To determine whether this was also the case for hESCs, we performed RNA-seq on the 18 hESC lines, and the corresponding iMeLCs in biological duplicate. We used the following parameters to define genes whose expression levels in iMeLCs are positively correlated with PGCLC induction efficiency. First, we chose genes that were expressed at low levels or not expressed in hESCs by setting the RPKM value < 2. Second, we used the RPKM value > 2 in at least one of the 18 iMeLC samples to select for genes that are upregulated in at least one of the 18 hESC lines induced to become iMeLCs. Third, we correlated gene expression in iMeLCs with PGCLC induction efficiency, and set the cutoff as >0.45. Based on these parameters, we found 78 genes upregulated from hESCs to iMeLCs that were also positively correlated with resulting PGCLC induction efficiency in the aggregates (Figure 2C). Using gene ontogeny (GO) term analysis of these 78 genes by WebGestalt [ 38, 39], we discovered that the top term was “formation of primary germ layer” (GO: 0001704), which included seven genes: EOMES, T, GATA6, MIXL1, GATA4, WLS, y LHX1. These genes are associated with primitive streak formation that are known to be induced by NODAL/ACTIVIN A (TGFβ) and WNT [ 40].

Signaling pathways that promote primitive streak formation are also required for PGCLC induction

Next, we confirmed the relationship between TGFβ and WNT signaling pathways, and the expression of T y EOMES in iMeLCs. We performed immunofluorescence and identified nuclear accumulation of phosphorylated SMAD2/3 (pSMAD2/3) (Figure 3A) and β-CATENIN (Figure 3B) in both iMeLCs and hESCs, indicating that these cells are capable of responding to both signaling pathways. We then confirmed expression of T (Figure 3C) and EOMES (Figure 3D) protein by immunofluorescence, and as predicted from the RNA-Seq, T was induced in iMeLCs (Figure 3C), and EOMES protein was expressed in both hESCs and in iMeLCs (Figure 3D).

TGFβ and WNT signaling are required for PGCLC induction from hESCs. (A--D) Expression of pSMAD2/3 (A), β-CATENIN (B), T (C), and EOMES (D) in UCLA1 hESCs and iMeLCs. Scale bar: 10 μm. (E) Schematic illustration of PGCLC induction with or without SB431542 (SB) and DKK1. (F) Real-time PCR for T y EOMES expression at iMeLCs in the presence of SB431542 and DKK1. (G) Flow cytometry showing loss of PGCLC competency in media containing SB431542 and DKK1.

TGFβ and WNT signaling are required for PGCLC induction from hESCs. (A--D) Expression of pSMAD2/3 (A), β-CATENIN (B), T (C), and EOMES (D) in UCLA1 hESCs and iMeLCs. Scale bar: 10 μm. (E) Schematic illustration of PGCLC induction with or without SB431542 (SB) and DKK1. (F) Real-time PCR for T y EOMES expression at iMeLCs in the presence of SB431542 and DKK1. (G) Flow cytometry showing loss of PGCLC competency in media containing SB431542 and DKK1.

The correlation of germline competency with TGFβ and WNT signaling, as well as T y EOMES induction promoted us to test if these molecules are critical for PGCLC formation. To block TGFβ signaling we added SB431542 [ 41], which inhibits the TGFβ type I receptors ALK5, ALK4, and ALK7, and phosphorylation of SMAD2 and SMAD3. This inhibitor does not block the ALKs or SMADs downstream of BMP4. To block WNT receptor binding, we added DKK1 [ 42] (Figure 3E). We discovered that the addition of these two molecules prevented the induction of T y EOMES in iMeLCs despite the presence of ACTIVIN A and GSK3βi in the iMeLC media (Figure 3F). In order to determine if T y EOMES expression is dependent on TGFβ or WNT, or both, we evaluated T y EOMES expression in iMeLCs in the presence of either SB431542 or DKK1. We found that T y EOMES were repressed in the presence of either SB431512 or DKK1 (Figure S4A and B), suggesting the expression of T y EOMES in iMeLCs requires both TGFβ and WNT signaling. To evaluate the effect on germline competency, we induced PGCLCs in media with or without SB431542 and DKK1 (Figure 3E). We discovered that the PGCLC population was completely abolished when SB431542 and DKK1 were included in the media, despite the presence of exogenous BMP4 and other cytokines known to induce PGCLC fate (Figure 3G). These results suggest that the ability to respond to TGFβ and WNT signaling and potentially the induction of genes associated with primitive streak formation such as T y EOMES are required for germline induction.

EOMES is required for PGCLC induction

To provide direct evidence for EOMES in PGCLC induction, we used CRISPR/Cas9 to mutate EOMES in the UCLA1 hESC line (Figure S4C). We used two independent EOMES mutant clones for analysis. By differentiating the EOMES mutant and control hESC lines in parallel, we found that the ITGA6/EPCAM double positive PGCLC population was dramatically reduced in the EOMES mutant clones (Figure 4A–B). To confirm this result, we also performed immunofluorescence on aggregates and detected PGCLCs by triple staining for TFAP2C, SOX17, and PRDM1. In wild-type control cells, we detected clusters of triple TFAP2C, SOX17, and PRDM1 human PGCLCs (Figure 4C, white dot outlined). Sin embargo, en el EOMES mutant lines, we identified very few triple positive PGCLCs (Figure 4C, white arrowheads). Therefore, our results demonstrate that EOMES is required for PGCLC formation in human, most likely downstream of WNT and TGFβ.

EOMES is required for PGCLC induction from hESCs. (A) Flow cytometry showing reduced PGCLC competency in EOMES mutant hESC line. PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Summary of PGCLC induction percentage from control and two different EOMES mutant hESC clones. (C) Control and EOMES mutant day 4 aggregates stained with TFAP2C (green), SOX17 (red), PRDM1 (purple), and DAPI (white). White dot outlines TFAP2C/SOX17/PRDM1 triple positive PGCLCs in control. White arrowheads point to rare TFAP2C/SOX17/PRDM1 triple positive PGCLCs in EOMES mutante. (D) Flow cytometry analysis of PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative and GFP positive wild-type hESCs. Left panel shows GFP positive cells in all live cells from PGCLC aggregates. Middle panel shows PGCLCs positive for ITGA6 and EPCAM. Right panel shows GFP positive PGCLCs. (E) Same analysis as (D) for PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative wild-type hESCs and GFP positive EOMES mutant hESCs.

EOMES is required for PGCLC induction from hESCs. (A) Flow cytometry showing reduced PGCLC competency in EOMES mutant hESC line. PGCLCs were identified as ITGA6/EPCAM double positive cells. (B) Summary of PGCLC induction percentage from control and two different EOMES mutant hESC clones. (C) Control and EOMES mutant day 4 aggregates stained with TFAP2C (green), SOX17 (red), PRDM1 (purple), and DAPI (white). White dot outlines TFAP2C/SOX17/PRDM1 triple positive PGCLCs in control. White arrowheads point to rare TFAP2C/SOX17/PRDM1 triple positive PGCLCs in EOMES mutante. (D) Flow cytometry analysis of PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative and GFP positive wild-type hESCs. Left panel shows GFP positive cells in all live cells from PGCLC aggregates. Middle panel shows PGCLCs positive for ITGA6 and EPCAM. Right panel shows GFP positive PGCLCs. (E) Same analysis as (D) for PGCLCs made from mixed iMeLCs (1:1 ratio) made from GFP negative wild-type hESCs and GFP positive EOMES mutant hESCs.

In cyno embryos, nascent PGCs in the amnion are negative for EOMES [ 3]. Similarly, our RNA-seq data show that EOMES is not expressed in prenatal PGCs or PGCLCs. Therefore, we hypothesize that EOMES acts either noncell autonomously in the niche to support PGCLC formation, or alternatively EOMES acts cell autonomously in iMeLCs to prime PGC fate. To test this, we made stable GFP lines of control and EOMES mutant hESCs. We made iMeLCs and generated PGCLC aggregates containing a mix of GFP and unlabeled cells in a 1:1 ratio. The iMeLC mixtures were composed of GFP-labeled control cells with unlabeled controls (Figure 4D) or GFP-labeled EOMES mutant cells with unlabeled controls (Figure 4E). In the controls, about 45% of the total cells were positive for GFP, and about 35% of the PGCLCs were positive. Therefore, control hESCs with or without GFP both contribute to PGCLC induction (Figure 4D). In contrast, only about 8% of the PGCLCs were induced from GFP-labeled EOMES mutant cells, whereas the total cells were composed of about 48% GFP-labeled EOMES mutant cells (Figure 4E). This suggests that EOMES is required cell autonomously to prime PGC fate.


New genetic tools for hPSC research

To use hPSCs for studies of human development and disease, it is essential to develop powerful genetic tools. Below, we highlight recent advances that enable both the generation of tissue-specific fluorescent reporter lines and the perturbation of gene expression. The strengths and weaknesses of transgenic approaches have been extensively discussed elsewhere (Giudice and Trounson, 2008) of note, the main advantages are the convenience and experimental feasibility of the approach, while the drawbacks include position effects, copy number variation and transgene silencing. Instead, we focus on the gene targeting approach, which has undergone a major transformation in recent years and may revolutionize genetic studies in hPSCs.

Gene targeting mediated by ZFNs and TALENs

Gene targeting refers to the introduction of site-specific modifications into the genome by homologous recombination (HR). This approach is widely used in the mouse to generate null (complete loss-of-function) or hypomorphic (partial loss-of-function) mutations, or to create reporter genes to track the expression of an endogenous transcript. Since the first successful targeting of the mouse Hprt gene (Doetschman et al., 1987 Thomas and Capecchi, 1987), numerous murine genes have been targeted. However, only a small number of loci have been successfully targeted using conventional gene targeting methods in hPSCs, owing to the low efficiency of HR (Hockemeyer and Jaenisch, 2010). This is now poised to change.

It has long been recognized that inducing a DNA double-stranded break (DSB) at the target locus substantially increases the efficiency of HR (Puchta et al., 1993 Rouet et al., 1994 Smih et al., 1995). Based on this idea, two methods have been developed to introduce DSBs at the target site. These involve zinc-finger nucleases (ZFNs see Box 1) and, more recently, transcription activator-like (TAL) effector nucleases (TALENs see Box 1). These engineered chimeric proteins are composed of separate DNA-binding and DNA-cleavage domains, which enable them to act as ‘genomic scissors’ that can induce DNA breaks at specific genomic loci. In the presence of a donor DNA fragment containing homology arms to the target locus, HR-mediated DNA repair results in the insertion of the donor DNA sequence into the specific genomic locus. This approach can be used to generate point mutations, genomic deletions and insertions of reporter genes.


Ver el vídeo: Ciencia express: Qué son las células madre (Mayo 2022).


Comentarios:

  1. Willifrid

    No tiene sentido.

  2. Blaine

    Pido disculpas, no se acerca a mí. ¿Quién más puede decir qué?

  3. Xiomar

    Sí, de hecho. Estoy de acuerdo con todo lo anterior. Podemos comunicarnos sobre este tema. Aquí o en PM.

  4. Rikward

    En ella algo es. Muchas gracias por la ayuda en este asunto. No sabía esto.

  5. Shazuru

    Esta magnífica frase, por cierto, está cayendo

  6. Ike

    la pregunta graciosa

  7. Kazrakora

    Creo que no tienes razón. Estoy seguro. Escribe en PM, nos comunicaremos.



Escribe un mensaje