Información

Máquinas de Turing ribosomales, cálculo de ADN / ARN

Máquinas de Turing ribosomales, cálculo de ADN / ARN


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Soy un tipo de ciencias de la computación, recientemente crucé para hacer una investigación en biología computacional sobre la predicción de estructuras secundarias de ARN. Mientras miraba a través de los materiales, se me ocurrió una idea loca, ¿qué pasaría si pudieras diseñar un ribosoma sintético que actúe como una máquina de Turing en cadenas de ARN? (podrías hacer cosas similares con las enzimas de ADN)

Las aplicaciones inmediatas podrían ser cosas como corregir mutaciones en el ARN para curar enfermedades genéticas, que es un cálculo relativamente simple:

  1. Comprueba si una cuerda está defectuosa.
  2. Si es así, corrija la letra incorrecta.

Otro podría ser "triturar" el ADN / ARN de los virus:

  1. Compruebe si una cadena es un virus.
  2. Si es así, tritúrelo.

No estoy seguro del estado de la literatura sobre esto, o de la capacidad de la biología sintética para crear algo así. ¿Crees que es buena idea seguir esta idea o no?

Me doy cuenta de que esta es una pregunta suave. Quizás uno mejor sería, ¿es esto posible?


No soy un experto en esto pero no creo que se necesite una máquina de Turing para lograrlo, al menos para el ADN, ya que en sentido convencional (sin incluir factores cancerígenos como los rayos UV) la etapa más probable en la que se puede producir una mutación del ADN. Sucede es durante la replicación del ADN, por lo que la ADN polimerasa se compromete a revisar para garantizar una replicación precisa del ADN, y luego el ADN puede volver a ser heterocromático (eventualmente). Esto será más difícil para el ARN, ya que son monocatenarios, aunque se pliegan sobre sí mismos.

También hay muchas cadenas de ARN que se producen mediante empalme alternativo, recombinación VDJ y reordenamientos imprecisos de RAG para la producción de anticuerpos, que pueden dar lugar a infinitas producciones de ARN posibles. Entonces, ¿cómo sabría qué es "bueno" y qué es "malo" en términos de ARN y su producción? La mitad del tiempo ni siquiera sabemos lo que hacen y cuáles son sus funciones, y la única razón por la que llamamos a algo como un ARN "malo" o "defectuoso" es porque está teniendo un efecto negativo, no porque comprendamos la función precisa de la secuencia, lo que significa que una tabla teórica sería inútil.

Entonces, en resumen, una maquinaria de proteínas de estilo turing no es posible (debido al número potencial casi infinito de ARN producido) ni factible (ya que la cantidad de proteínas que tendrían que verificar cada secuencia de ARN a su vez tendría que ser casi infinita). Y ninguno de estos tiene en cuenta los SNP, es decir, variaciones individuales, que pueden producir proteínas con una secuencia diferente pero una estructura / función idéntica, ya que obviamente se seleccionaría cualquier variación letal, pero ese es un argumento completamente diferente.


Máquinas de Turing ribosomales, cálculo de ADN / ARN - Biología

Estamos interesados ​​en todos los aspectos del diseño y análisis de algoritmos combinatorios. La investigación en curso incluye:

  • algoritmos de aproximación,
  • algoritmos en línea,
  • geometría Computacional,
  • dibujo gráfico,
  • recuperación de información,
  • análisis de caso promedio de algoritmos,
  • complejidad computacional.

Estamos especialmente interesados ​​en los problemas algorítmicos que surgen en la biología molecular computacional, tales como:


Un nuevo descubrimiento muestra que las células humanas pueden escribir secuencias de ARN en el ADN

Las células contienen maquinaria que duplica el ADN en un nuevo conjunto que entra en una célula recién formada. Esa misma clase de máquinas, llamadas polimerasas, también construyen mensajes de ARN, que son como notas copiadas del depósito central de ADN de recetas, por lo que se pueden leer de manera más eficiente en proteínas. Pero se pensaba que las polimerasas solo funcionaban en una dirección del ADN al ADN o al ARN. Esto evita que los mensajes de ARN se vuelvan a escribir en el libro de recetas maestro de ADN genómico. Ahora, los investigadores de la Universidad Thomas Jefferson proporcionan la primera evidencia de que los segmentos de ARN se pueden volver a escribir en el ADN, lo que potencialmente desafía el dogma central en biología y podría tener amplias implicaciones que afectan a muchos campos de la biología.

"Este trabajo abre la puerta a muchos otros estudios que nos ayudarán a comprender la importancia de tener un mecanismo para convertir los mensajes de ARN en ADN en nuestras propias células", dice Richard Pomerantz, Ph.D., profesor asociado de bioquímica y biología molecular en Universidad Thomas Jefferson. "La realidad de que una polimerasa humana puede hacer esto con alta eficiencia plantea muchas preguntas". Por ejemplo, este hallazgo sugiere que los mensajes de ARN pueden usarse como plantillas para reparar o reescribir el ADN genómico.

El trabajo fue publicado el 11 de junio en la revista Avances científicos.

Junto con el primer autor Gurushankar Chandramouly y otros colaboradores, el equipo del Dr. Pomerantz comenzó investigando una polimerasa muy inusual, llamada polimerasa theta. De las 14 ADN polimerasas en células de mamíferos, solo tres hacen la mayor parte del trabajo de duplicar todo el genoma para prepararlo para la división celular. Los 11 restantes están involucrados principalmente en la detección y reparación cuando hay una rotura o error en las hebras de ADN. La polimerasa theta repara el ADN, pero es muy propensa a errores y comete muchos errores o mutaciones. Por lo tanto, los investigadores notaron que algunas de las cualidades "malas" de la polimerasa theta eran las que compartía con otra máquina celular, aunque una más común en los virus: la transcriptasa inversa. Al igual que Pol theta, la transcriptasa inversa del VIH actúa como una ADN polimerasa, pero también puede unirse al ARN y leer el ARN en una hebra de ADN.

En una serie de elegantes experimentos, los investigadores probaron la polimerasa theta contra la transcriptasa inversa del VIH, que es una de las mejor estudiadas de su tipo. Demostraron que la polimerasa theta era capaz de convertir mensajes de ARN en ADN, lo que hizo tan bien como la transcriptasa inversa del VIH, y que en realidad hizo un mejor trabajo que al duplicar ADN en ADN. La polimerasa theta fue más eficiente e introdujo menos errores al usar una plantilla de ARN para escribir nuevos mensajes de ADN que al duplicar ADN en ADN, lo que sugiere que esta función podría ser su propósito principal en la célula.

El grupo colaboró ​​con el laboratorio del Dr. Xiaojiang S. Chen en la USC y utilizó cristalografía de rayos X para definir la estructura y descubrió que esta molécula podía cambiar de forma para acomodar la molécula de ARN más voluminosa, una hazaña única entre las polimerasas.

"Nuestra investigación sugiere que la función principal de la polimerasa theta es actuar como una transcriptasa inversa", dice el Dr. Pomerantz. "En las células sanas, el propósito de esta molécula puede ser la reparación del ADN mediada por el ARN. En las células no saludables, como las cancerosas, la polimerasa theta se expresa en gran medida y promueve el crecimiento de las células cancerosas y la resistencia a los medicamentos. Será emocionante comprender mejor cómo La actividad de la polimerasa theta sobre el ARN contribuye a la reparación del ADN y la proliferación de las células cancerosas ".


Máquinas de Turing ribosomales, cálculo de ADN / ARN - Biología

Resumen de la presentación: Show

La represión postranscripcional por microARN (miARN) ocurre a través de la desestabilización de la transcripción o inhibición de la traducción. Mientras que el consenso general es que la degradación del ARN explica la mayor parte de la represión dependiente de miARN, la desintegración de la transcripción se produce co-traduccionalmente, lo que plantea interrogantes sobre el requisito de la traducción de la diana a la desestabilización de la transcripción dependiente de miARN. Para evaluar la importancia de la traducción a la desestabilización del ARN mediada por miARN, desacoplamos estos dos procesos moleculares diseccionando el impacto de la pérdida de función del miARN en los ARN no codificantes largos citosólicos (lncRNA). Demostramos que, a pesar de interactuar con el complejo de silenciamiento inducido por ARN cargado de miARN, la abundancia en estado estable y las tasas de degradación de estas transcripciones no traducidas expresadas de forma endógena se ven mínimamente afectadas por la pérdida de miARN. Forzar la asociación entre los lncRNA y la traducción de ribosomas, mediante la fusión de transcripciones no codificantes candidatas al extremo 3 de un gen informador que codifica una proteína, da como resultado la desestabilización de la transcripción dependiente de miARN. Además, un análisis más detallado de los lncRNA que experimentan una desestabilización dependiente de miRNA reveló que están asociados con la traducción de ribosomas y probablemente sean micropéptidos mal anotados. Nuestro análisis reveló que las transcripciones codificantes y no codificantes se ven afectadas de manera diferente por los miARN y respaldan el requisito estricto de traducción para la desestabilización de la transcripción dependiente de miARN.

Resumen de la presentación: Show

El hígado exhibe una zonación metabólica sorprendente, con funciones y patrones de expresión distintos para los hepatocitos proximales a la vena porta en comparación con las células que rodean la vena central. Sin embargo, se sabe poco sobre la zonificación de los lncRNA hepáticos, que tienen diversas funciones y actividades reguladoras. Analizamos los datos de RNA-seq de una sola célula de hígado de ratón (Smart-seq2, Drop-Seq) para detectar mRNA que codifican proteínas y lncRNA con resolución de una sola célula. Se detectaron 4.500 lncRNA expresados ​​en hígado a> 4 transcripciones por millón de lecturas. El análisis de Seurat identificó 130 lncRNA como marcadores específicos para tipos de células hepáticas individuales: hepatocitos, células endoteliales, células de Kupffer, células B y células NK. Otros 28 lncRNAs mostraron patrones de expresión de hepatocitos en zonas basados ​​en genes de referencia establecidos. También identificamos lncRNA que mostraban una expresión sesgada por el sexo. Además, se detectaron 234 de 412 lncRNA que responden al hepatocarcinógeno no genotóxico TCPOBOP, que incluyen lncRNA específicos para grupos de no hepatocitos y lncRNA que muestran expresión zonada en hepatocitos. Estos hallazgos se están utilizando para identificar dianas de genes que codifican proteínas de lncRNA reguladores co-localizados en la zona y obtener información sobre las vías biológicas basadas en la zona que pueden regular. Estos análisis también demuestran que la exposición a xenobióticos puede desregular los lncRNA expresados ​​en múltiples tipos de células hepáticas.

  • Xin Lai, Universitätsklinikum Erlangen, Alemania
  • Julio Vera, Universitätsklinikum Erlangen, Alemania

Resumen de la presentación: Show

Las altas tasas de resultado letal en la metástasis tumoral están asociadas con la adquisición de quimiorresistencia. Varios estudios clínicos indican que la sobreexpresión de E2F1 culmina en un pronóstico desfavorable y quimiorresistencia en los pacientes. Por lo tanto, ajustar la expresión de E2F1 podría ser un enfoque prometedor para el tratamiento de pacientes que muestran quimiorresistencia. Integramos bioinformática, modelado estructural y cinético y experimentos para estudiar la regulación cooperativa de E2F1 por microARN en el contexto de la quimiorresistencia. Demostramos que se puede lograr una mayor eficiencia de represión de E2F1 en células tumorales quimiorresistentes a través de dos microARN cooperantes. Luego empleamos simulaciones de dinámica molecular para mostrar que miR-205-5p y miR-342-3p pueden formar el tríplex más estable con ARNm de E2F1. Un modelo matemático que simulaba la regulación de E2F1 por los microARN cooperativos predijo una mayor represión de E2F1, una característica que se verificó mediante experimentos in vitro. Finalmente, integramos esta regulación cooperativa de microARN en una red más completa para tener en cuenta la quimiorresistencia relacionada con E2F1 en las células tumorales. Las simulaciones del modelo de red y los datos experimentales indican la capacidad de expresión mejorada tanto de miR-205-5p como de miR-342-3p para disminuir la quimiorresistencia tumoral reprimiendo cooperativamente E2F1. Nuestros resultados sugieren que los pares de microARN cooperantes podrían usarse como posibles terapias de ARN para reducir la quimiorresistencia relacionada con E2F1.

  • Maina Bitar, QIMR Berghofer, Australia
  • Isabela Pimentel de Almeida, Universidade de Sao Paulo y QIMR Berghofer, Brasil
  • Elizabeth O'Brien, QIMR Berghofer, Australia
  • Guy Barry, QIMR Berghofer, Australia

Resumen de la presentación: Show

Las células progenitoras somáticas son cruciales para el desarrollo y mantenimiento de los tejidos humanos. Estas células no especializadas, a menudo específicas de tejidos, han comenzado recientemente a usarse clínicamente para la reparación y regeneración de órganos. Como poblaciones de células únicas, su composición molecular es de gran interés y las vistas panorámicas de su paisaje transcripcional pueden respaldar nuevos desarrollos en el campo. Aquí investigamos por primera vez un conjunto de cinco tipos distintos de células progenitoras humanas utilizando herramientas de bioinformática de última generación. Descubrimos similitudes y diferencias entre los tipos de células en función de los perfiles de expresión de la transcripción revelados por RNA-Seq. Nuestros análisis sugieren una similitud general muy alta entre estas poblaciones de células progenitoras a nivel del transcriptoma. Aunque estas poblaciones de células tienen una alta similitud transcriptómica, exploramos las diferencias entre ellas y encontramos firmas transcripcionales únicas y transcripciones codificantes y no codificantes específicas del tipo celular. Este estudio muestra la alta similitud transcriptómica de las células progenitoras, pero que una minoría de transcripciones especializadas y expresadas de forma única son capaces de diferenciar cada tipo de célula. La exploración funcional de las similitudes y diferencias transcriptómicas entre las células progenitoras proporcionó un conocimiento esencial sobre los marcadores celulares únicos y las funciones compartidas y distintas necesarias para la diferenciación de las células progenitoras en poblaciones celulares definidas que constituyen nuestros tejidos y órganos.

  • Florian Erhard, Institut für Virologie und Immunbiologie, Julius-Maximilians-Universität Würzburg, Alemania

Resumen de la presentación: Show

Los enfoques actuales de secuenciación de ARN unicelular (scRNA-seq) analizan los perfiles de ARN total en un solo punto de tiempo, pero transmiten poca información sobre la dinámica temporal subyacente. Por lo tanto, (i) las respuestas a las perturbaciones no se pueden medir directamente, (ii) no se puede investigar la cinética de la transcripción, (iii) los cambios a corto plazo debido a una perturbación dentro de una escala de tiempo de unas pocas horas están enmascarados por el ARN preexistente y ( iv) los cambios en la síntesis y desintegración del ARN no se pueden diferenciar.
Presentamos SLAM-seq de célula única (scSLAM-seq), que integra el etiquetado de ARN metabólico, la conversión de nucleósidos bioquímicos y el scRNA-seq para registrar la actividad transcripcional. Un nuevo enfoque computacional (GRAND-SLAM) que desarrollamos recientemente nos permitió cuantificar con precisión tanto el ARN nuevo como el viejo para miles de genes en cientos de células individuales.
Aplicamos scSLAM-seq a la respuesta inicial a la infección por citomegalovirus lítico (CMV). Nuestros datos nos permitieron realizar análisis de dosis-respuesta a nivel de una sola célula. La mayor parte de la variabilidad de la eficacia de la infección, así como las respuestas de interferón y NF-kB, se debe a una combinación del estado del ciclo celular en el momento de la infección y la dosis de infección. Además, scSLAM-seq visualiza ráfagas transcripcionales. Mostramos que estos están asociados con características intrínsecas del promotor que indican que la metilación del ADN hace que los promotores no sean permisivos entre ráfagas transcripcionales.

Resumen de la presentación: Show

El colapso de la proteostasis, la disminución de la capacidad para hacer frente al estrés y mantener la homeostasis de las proteínas frente a desafíos externos, se ha establecido como un sello distintivo del envejecimiento. El colapso de la proteostasis por envejecimiento se ha caracterizado en los nematodos, sin embargo, aún sigue siendo controvertido si ocurre en el envejecimiento humano.
Aquí, utilizando RNA-seq y perfiles de huellas de ribosomas, caracterizamos la transcripción y traducción en fibroblastos humanos jóvenes frente a senescentes, y preguntamos cómo responden estas células al estrés proteotóxico en varios niveles reguladores de expresión de mRNA. Encontramos que las células senescentes mostraban un marcado deterioro en su capacidad para montar una respuesta transcripcional relacionada con el choque térmico. Curiosamente, la regulación de empalme alternativo relacionada con el estrés también disminuyó en las células senescentes. Sorprendentemente, observamos un desacoplamiento entre diferentes ramas reguladoras de la respuesta de proteína desplegada (UPR) en la senescencia. Mientras que las células jóvenes iniciaron respuestas tanto de traducción como de transcripción relacionadas con la UPR, las células senescentes mostraron una regulación de la traducción mejorada, así como la detección de estrés en el ER, sin embargo, no pudieron activar la respuesta transcripcional de la UPR.
Juntos, nuestros datos establecieron una primera caracterización de todo el transcriptoma del colapso de la proteostasis de la senescencia en varios niveles reguladores de la expresión del ARNm, y revelaron un deterioro general en la capacidad celular para montar programas de empalme alternativo y transcripcional de respuesta al estrés tras la senescencia.

  • Song-Yao Zhang, Universidad Politécnica del Noroeste, China
  • Shao-Wu Zhang, Universidad Politécnica del Noroeste, China
  • Xiao-Nan Fan, Universidad Politécnica del Noroeste, China
  • Teng Zhang, Universidad Politécnica del Noroeste, China
  • Jia Meng, Departamento de Ciencias Biológicas, HRINU, SUERI, Universidad Xi’an Jiaotong-Liverpool, China
  • Yuifei Huang, Departamento de Ingeniería Eléctrica e Informática, Universidad de Texas en San Antonio, Estados Unidos

Resumen de la presentación: Show

Motivación: Como la metilación de ARNm de mamíferos más abundante, la N6-metiladenosina (m6A) existe en> 25% de los ARNm humanos y participa en la regulación de muchos aspectos diferentes del metabolismo del ARNm, la diferenciación de células madre y enfermedades como el cáncer. Sin embargo, nuestro conocimiento actual sobre los cambios dinámicos de los niveles de m6A y cómo el cambio de los niveles de m6A para un gen específico puede desempeñar un papel en ciertos procesos biológicos como la diferenciación de células madre y enfermedades como el cáncer es en gran medida esquivo.
Resultados: Para abordar esto, proponemos en este artículo FunDMDeep-m6A un nuevo proceso para identificar el contexto específico (p. Ej., Enfermedad frente a células normales, diferenciadas frente a células madre o células de eliminación de genes frente a células de tipo salvaje) m6A- genes funcionales mediados. FunDMDeep-m6A incluye, en el primer paso, DMDeep-m6A, un método novedoso basado en un modelo de aprendizaje profundo y una prueba estadística para identificar sitios de metilación diferencial de m6A (DmM) a partir de datos MeRIP-Seq con una resolución de base única. FunDMDeep-m6A luego identifica y prioriza genes DmM funcionales (FDmMGenes) combinando los genes DmM (DmMGenes) con análisis de expresión diferencial utilizando un método basado en red. Este método de red propuesto incluye una nueva puntuación de puente de señalización m6A (MSB) para cuantificar la importancia funcional de DmMGenes mediante la evaluación de la interacción funcional de DmMGenes con sus vías de señalización mediante un proceso de difusión de calor en redes de interacción proteína-proteína (PPI). Los resultados de la prueba en 4 conjuntos de datos MeRIP-Seq específicos del contexto mostraron que FunDMDeep-m6A puede identificar FDmMGenes más específicos del contexto y funcionalmente significativos que m6A-Driver. El análisis de enriquecimiento funcional de estos genes reveló que m6A se dirige a genes clave de muchos procesos biológicos importantes relacionados con el contexto, incluido el desarrollo embrionario, la diferenciación de células madre, transcripción, traducción, muerte celular, proliferación celular y vías relacionadas con el cáncer. Estos resultados demuestran el poder de FunDMDeep-m6A para dilucidar las funciones reguladoras de m6A y sus roles en procesos biológicos y enfermedades.
Disponibilidad: el paquete R para DMDeep-m6A está disponible gratuitamente en https://github.com/NWPU-903PR/DMDeepm6A1.0.

  • Peter White, Instituto de Medicina Genómica del Nationwide Children's Hospital, Estados Unidos
  • Jeffrey Gaither, Instituto de Medicina Genómica del Nationwide Children's Hospital, Estados Unidos
  • David Gordon, Instituto de Medicina Genómica del Nationwide Children's Hospital, Estados Unidos
  • Grant Lammi, Instituto de Medicina Genómica del Hospital Nacional de Niños, Estados Unidos
  • Blythe Moreland, Instituto de Medicina Genómica del Hospital Nacional de Niños, Estados Unidos

Resumen de la presentación: Show

Las pautas actuales para la interpretación de variantes clasifican la mayoría de las variantes sinónimas (sSNV) como benignas. Los estudios de plegamiento de ARN sugieren que la estructura secundaria del ARNm es esencial para la transcripción y traducción, sin embargo, se desconoce en gran medida el potencial de sSNV patógenos que impactan el plegamiento de ARN en enfermedades humanas. Por lo tanto, nos propusimos probar la hipótesis de que los sSNV que se predice que alterarán la estabilidad del ARN mostrarían una restricción significativa en la población humana.

Realizamos un estudio sistemático de los SNP que afectan la estabilidad del ARN. Primero, desarrollamos un software novedoso basado en la nube utilizando Apache Spark, derivando métricas de plegamiento de ARN para cada posible polimorfismo en el transcriptoma humano (

500 millones de variantes). En segundo lugar, utilizamos frecuencias de alelos de la población para determinar si los valores de plegamiento de ARNm de SNP altamente disruptivos estaban restringidos. En tercer lugar, estas métricas se utilizaron para construir un índice de predictividad estructural (puntuación SPI).

Observamos que los sSNV que se predice que alterarán la estructura del ARNm están muy restringidos, lo que respalda la hipótesis de su papel en la enfermedad genética humana. Hasta donde sabemos, SPI es la primera métrica de este tipo que permite la evaluación de sSNV. Dado que

El 75% de los pacientes con enfermedades raras no tienen un hallazgo clínicamente relevante utilizando los enfoques de interpretación de variantes actuales que ignoran los sSNV, SPI tiene el potencial de permitir el descubrimiento de nuevas variantes patogénicas que impactan la estabilidad del ARN.

  • David S.M. Lee, Universidad de Pensilvania, Estados Unidos
  • Louis R. Ghanem, Children's Hospital of Philadelphia, Estados Unidos
  • Yoseph Barash, Universidad de Pensilvania, Estados Unidos

Resumen de la presentación: Show

La identificación de elementos reguladores en el genoma no codificante es un desafío fundamental en biología. Las secuencias G-quadruplex (G4) son abundantes en las regiones no traducidas (UTR) de los ARN mensajeros humanos, pero su importancia funcional sigue sin estar clara. Al integrar múltiples fuentes de datos genéticos y genómicos, mostramos que las supuestas secuencias formadoras de G-cuádruplex (pG4) en las UTR 5 'y 3' están selectivamente restringidas y enriquecidas para interacciones cis-eQTL y proteína de unión a ARN (RBP). Utilizando más de 15.000 secuencias de genoma completo, descubrimos patrones de selección con resolución de un solo nucleótido en UTR pG4 que respaldan su papel en la mediación de la unión de proteínas a través de la formación de estructuras secundarias. En paralelo, identificamos nuevas proteínas con evidencia de unión preferencial en pG4s de anotaciones ENCODE, y delineamos redes reguladoras putativas compuestas de objetivos de unión compartidos. Finalmente, al mapear variantes en el Catálogo NIH GWAS y ClinVar, encontramos enriquecimiento para la variación asociada a la enfermedad en 3'UTR pG4s. En una variante de pG4 de GWAS asociada con hipertensión en HSPB7, descubrimos un fuerte desequilibrio alélico en GTEx RNA-seq en múltiples tejidos, lo que sugiere que los cambios en la expresión génica asociados con la interrupción de pG4 subyacen a la asociación fenotípica observada. Tomados en conjunto, nuestros resultados establecen UTR G-quadruplex como importantes características cis-reguladoras, y apuntan a un vínculo putativo entre la interrupción dentro de UTR pG4 y la susceptibilidad a enfermedades humanas.

  • Russell Hamilton, Universidad de Cambridge, Reino Unido
  • Anne Ferguson-Smith, Universidad de Cambridge, Reino Unido
  • William Taylor, Francis Crick Institute, Reino Unido

Resumen de la presentación: Show

Las estructuras de ARN se forman a partir de emparejamientos de bases canónicos de Watson-Crick (A: U, C: G, G: U) que forman elementos estructurales tales como bucles de tallo. Sin embargo, los pares de bases no canónicos mediados a través de los bordes de hoogenstein y azúcar de los nucleótidos permiten muchas más combinaciones de pares de bases, lo que permite estructuras 3D más elaboradas. Se han sugerido motivos como G-quadruplex, i-motif y kink-turn para mediar en la traducción del ARN, sin embargo, las funciones de estos motivos siguen siendo enigmáticas. Por lo tanto, la predicción precisa de estos motivos es esencial para mejorar nuestra comprensión de las funciones de motivos de pares de bases no canónicas.

Los emparejamientos de bases de ARN predichos usando enfoques de mutación correlacionados pueden proporcionar restricciones poderosas en la conformación 2D / 3D de los motivos de ARN. Sin embargo, hemos demostrado anteriormente que los contactos predichos pueden ser demasiado erráticos para proporcionar predicciones 3D de ARN generalizadas. Para evaluar aún más esta limitación, evaluamos las predicciones de contacto realizadas por cuatro métodos (CCMpred, R-Scape, Plmc, pySCA) y comparamos su desempeño individual con bases de datos de ARN con estructuras conocidas (Rfam y RNA-puzzles). Luego producimos un consenso de restricciones, complementado con cálculos de energía mínima libre teniendo en cuenta el apilamiento de la base. El rendimiento de las restricciones de consenso se evalúa por su capacidad para predecir con precisión estructuras 3D. Discutimos las fortalezas y debilidades de cada uno de los métodos y presentamos los resultados como un recurso web dinámico.

  • Liang Huang, Oregon State University y Baidu Research USA, Estados Unidos
  • He Zhang, Baidu Research USA, Estados Unidos
  • Dezhong Deng, Universidad Estatal de Oregon, Estados Unidos
  • Kai Zhao, Universidad Estatal de Oregon, Estados Unidos
  • Kaibo Liu, Baidu Research USA, Estados Unidos
  • David Hendrix, Universidad Estatal de Oregon, Estados Unidos
  • David Mathews, Universidad de Rochester, Estados Unidos

Resumen de la presentación: Show

Motivación: predecir la estructura secundaria de una secuencia de ARN es útil en muchas aplicaciones. Los algoritmos existentes (basados ​​en programación dinámica) adolecen de una limitación importante: sus tiempos de ejecución escalan cúbicamente con la longitud del ARN, y esta lentitud limita su uso en aplicaciones de todo el genoma.

Resultados: Presentamos un novedoso algoritmo de programación dinámica de tiempo O (n3) alternativo para el plegamiento de ARN que es susceptible de heurísticas que lo hacen correr en el tiempo O (n) y el espacio O (n), al tiempo que produce una aproximación de alta calidad a la solucion optima. Inspirado por el análisis incremental de gramáticas libres de contexto en lingüística computacional, nuestro algoritmo de programación dinámica alternativo escanea la secuencia en una dirección de izquierda a derecha (5'-a-3 ') en lugar de de abajo hacia arriba, lo que nos permite para emplear la heurística de poda de haces efectiva. Nuestro trabajo, aunque inexacto, es el primer algoritmo de plegado de ARN que logra un tiempo de ejecución lineal (y espacio lineal) sin imponer restricciones a la estructura de salida. Sorprendentemente, nuestra búsqueda aproximada da como resultado una precisión general aún mayor en una base de datos diversa de secuencias con estructuras conocidas. Más interesante aún, conduce a predicciones significativamente más precisas sobre las familias de secuencias más largas en esa base de datos (ARN ribosómico 16S y 23S), así como a una precisión mejorada para pares de bases de largo alcance (500+ nucleótidos aparte), los cuales son bien conocidos. ser un desafío para los modelos actuales.

Disponibilidad: Nuestro código fuente está disponible en https://github.com/LinearFold/LinearFold, y nuestro servidor web está en http://linearfold.org (longitud máxima de secuencia en el servidor: 100,000nt).

Resumen de la presentación: Show

El ARNm puede formar estructuras locales y la fuerza de plegamiento local afecta la interacción con el ribosoma y se cree que influye en muchos aspectos adicionales de la expresión génica. Sin embargo, la forma en que la evolución da forma a la fuerza de la estructura del ARNm local en las secuencias codificantes aún no se comprende bien. En este estudio, realizamos el primer análisis de selección sobre la fuerza de la estructura secundaria en las secuencias de codificación de 513 especies considerando sus relaciones filogenéticas. Mostramos que las secuencias de codificación en phyla de los tres dominios de la vida contienen regiones consistentes de fuerza de estructura secundaria aumentada o disminuida. Estas regiones coinciden con secciones de ARNm involucradas en diferentes procesos de expresión génica y, en particular, diferentes etapas de traducción de proteínas (inicio, alargamiento y terminación), lo que indica que la fuerza de plegamiento tiene un papel en estos procesos. El aumento o la disminución de la fuerza de la estructura secundaria en diferentes partes de la secuencia codificante se correlacionan con los rasgos genómicos y ambientales y se interrumpe en las especies que se espera que tengan una selección débil para una expresión génica eficiente (como las especies con un sesgo de codón débil o replicación intracelular). Nuestros resultados sugieren que la fuerza de la estructura secundaria del ARNm se mantiene bajo selección para mejorar la eficiencia de expresión génica. Este mecanismo complementa otras características sinónimas de la secuencia codificante para regular las concentraciones de ARNm y optimizar el proceso de traducción.

  • Jan Gorodkin, Universidad de Copenhague, Dinamarca
  • Guilia Corsi, Universidad de Copenhague, Dinamarca
  • Ferhat Alkan, Universidad de Copenhague, Dinamarca

Resumen de la presentación: Show

El sistema CRISPR-Cas9 se ha convertido en una tijera de ADN muy popular en la edición del genoma. Sin embargo, no todos los ARN guía (ARNg) se escinden con la misma eficacia. En consecuencia, se ha elaborado una amplia variedad de métodos (de aprendizaje automático) que predicen la eficiencia, pero normalmente codifican> 600 características del ARNg como entrada junto con eficiencias determinadas experimentalmente como salida. Las características se derivan típicamente directamente de la secuencia primaria solamente, y se omiten las características relevantes potenciales del auto-plegamiento del gRNA y la interacción de unión con el ADN, mientras que las características redundantes pueden obstaculizar la precisión de la predicción. Aquí, analizamos las 629 características de entrada utilizadas para predecir la eficiencia de escisión de la herramienta Cas9-gRNA. Empleamos una validación cruzada de cinco veces con un conjunto de prueba independiente para diferentes arquitecturas de un árbol impulsado por gradiente y una estrategia de eliminación de características para reducir la cantidad de características de entrada a 129 sin pérdida de rendimiento. La adición de cinco funciones relacionadas con la energía produce una reducción a 98 funciones, al tiempo que aumenta el rendimiento en el conjunto de prueba independiente. Al comparar las 15 características de mayor peso entre los modelos entrenados, las características conocidas como la posición de corte se encuentran entre estas. Curiosamente, nuestras cinco características relacionadas con la energía se ponderan constantemente como características principales en los cinco modelos resultantes.

  • Charles Blatti, Universidad de Illinois en Urbana-Champaign, Estados Unidos
  • Mikel Heranez, Universidad de Illinois, en Urbana-Champaign, Estados Unidos
  • Waqar Arif, Universidad de Illinois en Urbana-Champaign, Estados Unidos
  • Auinash Kalsotra, Universidad de Illinois en Urbana-Champaign, Estados Unidos

Resumen de la presentación: Show

Ha habido un interés creciente en comprender la regulación de la traducción de ARNm dentro de una célula, o el translatome. Recientemente, los investigadores han acoplado RNA-Seq con perfiles de polisomas, una técnica bien establecida en la que el mRNA intacto se puede fraccionar en función del número de ribosomas asociados o su ocupación ribosómica. Los datos obtenidos de este método proporcionan una visión de todo el transcriptoma de la traducción del ARNm y tienen el potencial de arrojar luz sobre los mecanismos de regulación. Sin embargo, ha faltado una sólida canalización computacional para analizar estos datos. Los enfoques anteriores han utilizado técnicas de agrupación en el recuento de lecturas normalizadas para identificar las transcripciones con asociación ribosómica diferencial. Un gran inconveniente de este método es la falta de pruebas estadísticas para discriminar transcripciones con diferencias significativas. En el presente trabajo, proponemos un enfoque computacional robusto para el análisis de datos de Polysome Profiling RNA-Seq y la identificación de transcripciones que exhiben control de traducción. Llamamos a nuestra tubería Shirloc o Shifts in Ribosomal Occupancy. Utilizando conjuntos de datos disponibles públicamente, hemos descubierto que nuestra metodología es capaz de identificar miles de transcripciones con diversos grados de ocupación ribosómica. Sin embargo, nuestra cartera también ha revelado que una parte significativa de las transcripciones expresadas muestran una gran variabilidad y su ocupación ribosómica relativa no se puede determinar con seguridad.

Resumen de la presentación: Show

Cada vez está más claro que las proteínas de unión a ARN son elementos clave en la regulación del transcriptoma de la célula. CLIP-seq es una de las herramientas principales para determinar los sitios de unión, pero sufre de una alta tasa de falsos negativos debido a su dependencia de la expresión. Esta crítica dificulta el uso de datos CLIP públicos. Mostraremos en varios ejemplos cómo el uso de datos CLIP-seq públicos sin procesar puede conducir a un razonamiento biológico falso y cómo el enfoque avanzado de aprendizaje automático puede solucionar este problema. También presentaré alguna aplicación reciente de un enfoque que nos permite determinar el mecanismo subyacente de la regulación postranscripcional que solo se puede determinar mediante el uso de predicciones basadas en datos CLIP. Hemos introducido el enfoque MechRNA, que combina evidencias de predicción para determinar los mecanismos moleculares de la regulación basada en ARN.

Tugce Aktas, Ibrahim Avsar Ilik,. , Thomas Manke, Rolf Backofen y Asifa Akhtar.
DHX9 suprime los defectos de procesamiento del ARN originados por la invasión de Alu del genoma humano. Naturaleza, 2017.

Alexander R. Gawronski, Michael Uhl,. , S. Cenk Sahinalp y Rolf Backofen.
MechRNA: predicción de los mecanismos de lncRNA a partir de interacciones RNA-RNA y RNA-proteína. Bioinformática, 2018

  • Gabrielle Deschamps-Francoeur, Universidad de Sherbrooke, Canadá
  • Michelle Scott, Universidad de Sherbrooke, Canadá

Resumen de la presentación: Show

Los ARN nucleolares pequeños (ARNsno) son ARN pequeños no codificantes separados en dos familias, las cajas C / D y H / ACA, que se sabe, respectivamente, que guían la metilación y la pseudouridilación de los ARN ribosomales y nucleares pequeños. Estas funciones están bien caracterizadas y requieren una interacción con regiones específicas de los snoRNA. En los seres humanos, sin embargo, algunos snoRNA no tienen objetivos canónicos conocidos. Además, algunos snoRNA exhiben funciones no canónicas, como la regulación del corte y empalme alternativo y de la estabilidad del mRNA, cuya desregulación se ha implicado en enfermedades como el síndrome de Prader-Willi y el cáncer. Se desarrollaron nuevas metodologías que permiten la detección de alto rendimiento de interacciones ARN-ARN. El estudio de estos conjuntos de datos reveló que las interacciones canónicas solo representan el 5% de todas las interacciones snoRNA.
El objetivo de este proyecto es desarrollar una herramienta para predecir las interacciones del snoRNA, tanto canónicas como no canónicas, utilizando una red neuronal artificial. Los conjuntos de datos obtenidos utilizando metodologías de identificación de interacciones de alto rendimiento se analizaron y compararon, junto con una curación de la literatura. Las secuencias de interacción se introdujeron en el algoritmo, lo que resultó en una precisión de 0,78.
Con esta herramienta, podremos predecir nuevas interacciones potenciales de snoRNA, arrojando luz sobre sus funciones no canónicas y su implicación en diferentes enfermedades.

  • Xiangying Sun, Purdue University, Estados Unidos
  • Zhezhen Wang, Universidad de Chicago, Estados Unidos
  • Carlos Perez-Cervantes, Universidad de Chicago, Estados Unidos
  • Alex Ruthenburg, Universidad de Chicago, Estados Unidos
  • Ivan Moskowitz, Universidad de Chicago, Estados Unidos
  • Michael Gribskov, Purdue University, Estados Unidos
  • Xinan Yang, Universidad de Chicago, Estados Unidos

Resumen de la presentación: Show

La mayoría de los ARN no codificantes largos (lncRNA) se localizan en el núcleo celular para influir en procesos biológicos importantes. La secuenciación moderna de ARN de núcleos y / o sus componentes ha revelado lncRNA reguladores en cis, incluido el ARN nuclear enriquecido con cromatina (cheRNA) que está estrechamente unido a la cromatina. Sin embargo, falta una tubería analítica rigurosa para la secuencia de ARN nuclear. En este estudio, examinamos cuatro estrategias computacionales para el análisis de datos de ARN-seq nuclear y mostramos el rendimiento superior de una nueva tubería (Tuxedo) en el ensamblaje completo del transcriptoma y la identificación precisa de ARNrc. Al analizar conjuntos de datos de K562 bien estudiados con la tubería de Tuxedo, caracterizamos las características genómicas del ARN cheRNA intergénico (icheRNA) que es similar a las del ARN potenciador (eRNA). Además, cuantificamos la correlación transcripcional de icheRNA y genes adyacentes, afirmando que icheRNA se asocia más positivamente con su gen vecino en expresión que el eRNA predicho por métodos de última generación o señales CAGE (análisis cap de expresión génica). Además, proponemos icheRNA coincidente con las marcas H3K9me3 como un predictor muy eficaz para el nuevo eRNA basado en cromatina, y una función cis-represiva potencial de cheRNA antisentido (as-cheRNAs), estas actividades probablemente estén involucradas en la modulación transitoria de cis específicos del tipo celular -regulación. Estos hallazgos demuestran que un análisis computacional riguroso de la secuencia de ARN nuclear arrojará nueva luz sobre la regulación cis.

Resumen de la presentación: Show

Los microARN (miARN) son pequeños ARN no codificantes que regulan las expresiones génicas postranscripcionalmente uniendo la secuencia complementaria de sus ARN mensajeros diana (ARNm). Estudios recientes revelan que los pares de miARN pueden reprimir la traducción del ARNm diana de una manera sinérgica cuando se unen entre sí y provocan una regulación a la baja más fuerte de su ARNm diana. Nuestro conocimiento sobre pares de miARN sinérgicos es muy limitado. Para identificar los pares de miARN cooperativos, proponemos un nuevo método: miRCoop. miRCoop hace uso de las herramientas de predicción de objetivos miARN - ARNm para encontrar pares de miARN que se predice que apunten al mismo ARNm con sitios de unión no superpuestos. Utilizando estos posibles tripletes, realizamos pruebas de interacción estadística basadas en el núcleo en los perfiles de expresión de miRNA y mRNA para identificar tripletes para los cuales las expresiones de los miRNA son estadísticamente independientes de la expresión del mRNA cuando se toman individualmente pero son dependientes cuando se toman juntas. Aplicamos miRCoop en perfiles de expresión de pacientes con cáncer de riñón. Cuando se aplica a los perfiles de expresión de pacientes con cáncer de riñón, encontramos 503 interacciones miARN: miARN: ARNm potencialmente cooperativas. Varios de estos miARN están regulados con el mismo factor de transcripción. Además, hay pares agrupados en el genoma. Esperamos que miRCoop facilite el mapeo del panorama funcional de miARN.

  • He Zhang, Baidu Research USA, Estados Unidos
  • Liang Huang, Oregon State University y Baidu Research USA, Estados Unidos

Resumen de la presentación: Show

La mayoría de los ncRNA funcionan a través de interacciones RNA-RNA. Se desea una predicción de la estructura secundaria de ARN rápida y confiable teniendo en cuenta la interacción ARN-ARN. Algunas herramientas existentes, como RNAhybrid y RNAduplex, no solo son menos informativas sino también menos precisas debido a que omiten la competencia entre pares de bases intermoleculares e intramoleculares. Otro grupo de herramientas, como RNAup, se centra en predecir la región de unión en lugar de predecir la estructura de plegamiento de dos cadenas. Algunas otras herramientas como RNAcofold son lentas. Presentamos LinearCoFold, que es capaz de predecir la estructura de plegado conjunto libre de pseudo nudos en tiempo de ejecución lineal y espacio.LinearCoFold es un enfoque de plegado global sin restricción en la longitud del par de bases y puede generar pares de bases tanto intermoleculares como intramoleculares. LinearCoFold extiende LinearFold al co-plegado de dos cadenas mediante la concatenación de dos ARN que interactúan y adopta una programación dinámica (DP) de izquierda a derecha. Esta forma de DP alternativa le permite aplicar la heurística de poda de haces para lograr una mejora del rendimiento. LinearCoFold es 6 veces más rápido que RNAcofold para el complejo RNA-RNA con más de 6000 nucleótidos. Incluso el uso de la búsqueda aproximada LinearCoFold también es más preciso en comparación con RNAcofold: el PPV / Sensibilidad general aumenta en 0,99 / 3,39. LinearCoFold también mejora significativamente la precisión en las familias más largas. Para la familia más larga, PPV / Sensibilidad se mejora en 13,33 / 15,38, respectivamente.

  • Chenkai Li, Centro de Ciencias del Genoma del Cáncer de BC, Canadá
  • Chen Yang, Centro de Ciencias del Genoma del Cáncer de BC, Canadá
  • Ka Ming Nip, Centro de Ciencias del Genoma del Cáncer de BC, Canadá
  • Rene Warren, BC Cancer, Centro de Ciencias del Genoma, Canadá
  • Inanc Birol, Centro de Ciencias del Genoma del Cáncer de BC, Canadá

Resumen de la presentación: Show

Los avances recientes en las tecnologías de secuenciación de alto rendimiento han permitido un análisis completo del transcriptoma con resolución de nivel básico. Sin embargo, los sesgos intrínsecos, como el contenido de GC y los ciclos de PCR, dificultan el ensamblaje y la anotación de los extremos 5 'y 3' de las isoformas de la transcripción. En consecuencia, las secuencias de transcripción reconstruidas pueden estar incompletas, potencialmente faltan regiones no traducidas, lo que resulta en análisis funcionales y regulatorios poco confiables. Por lo tanto, es deseable tener una canalización de anotaciones de completitud para las transcripciones ensambladas e incorporarlas en las rutinas de análisis de RNA-seq. Aquí presentamos Termin (A) ntor, una utilidad de anotación de transcripciones que se basa en dos clasificadores de redes neuronales profundas. Con una secuencia tan corta como 20 pb desde el extremo 5 'o 3' de la secuencia de transcripción ensamblada, nuestros modelos logran una precisión de anotación> 81% y> 87% del sitio de inicio de la transcripción 5 'y el sitio de poliadenilación 3' (sitio Poly (A) ), respectivamente. Mediante la evaluación comparativa del rendimiento de predicción del sitio Poly (A) en dos muestras de secuencia de ARN humano, Termin (A) ntor demuestra una mayor sensibilidad y precisión que los métodos más avanzados. Realizamos un experimento de especies cruzadas para mostrar la capacidad de Termin (A) ntor para anotar especies con precisión sin una buena anotación de referencia o genoma.

  • Joël Simoneau, Universidad de Sherbrooke, Canadá
  • Simon Dumontier, Universidad de Sherbrooke, Canadá
  • Ryan Gosselin, Universidad de Sherbrooke, Canadá
  • Michelle Scott, Universidad de Sherbrooke, Canadá

Resumen de la presentación: Show

El proceso de transformación de los datos de secuenciación de RNA-seq en una cuantificación significativa de las características de los genes se puede descomponer en una serie de pasos definidos. Existen cientos de software diferentes y varios recursos biológicos diferentes para cumplir con los diferentes pasos. Por lo tanto, los usuarios deben definir un conjunto de pasos (por ejemplo, software de recorte, alineación y cuantificación, además de un ensamblaje y anotación del genoma) para procesar conjuntos de datos de secuencia de ARN. Sin embargo, los usuarios actualmente no pueden confiar en una evaluación exhaustiva de la importancia de cada elección de diseño para crear su propio análisis adecuado. Nuestro objetivo es caracterizar la importancia relativa de cada paso metodológico en RNA-seq en la cuantificación de genes. Primero, el uso actual de software, genoma y anotación genómica se caracterizó a lo largo de la literatura mediante la realización de una revisión metodológica. En segundo lugar, utilizando diferentes permutaciones de software y referencias destacadas por la revisión metodológica, exploramos los sesgos de los pasos utilizando enfoques estadísticos. A través de una revisión metodológica y análisis estadísticos de los datos de RNA-seq, mostramos que la elección de la anotación del genoma no solo tiene el mayor impacto de la cuantificación de genes, sino que también es la elección de diseño menos descrita en la literatura. Creemos que la importancia de la anotación del genoma en la cuantificación se ha subestimado y no se ha caracterizado a fondo.

  • Jasleen Grewal, Centro de Ciencias del Genoma Michael Smith de Canadá, Canadá
  • Steven Jones, BC Cancer, Centro de Ciencias del Genoma, Canadá

Resumen de la presentación: Show

Los experimentos de RNA-Seq producen mediciones de expresión génica no sesgadas con un alto rango dinámico y una cobertura completa del transcriptoma. A pesar de esto, la mayoría de las tareas de interpretación de los datos de RNA-Seq utilizan subconjuntos de genes seleccionados por priorización estadística o conocimiento previo. Este enfoque pasa por alto el impacto de genes poco estudiados y cambios biológicos difusos, y puede influir en nuestra comprensión de etiologías inusuales. Esto es particularmente relevante cuando se analizan los fundamentos biológicos de cánceres raros y avanzados.
Nuestro método aprovecha la inferencia bayesiana para aproximar la distribución generativa a partir de la cual se originan los transcriptomas individuales de RNA-Seq. Usamos este método para desarrollar representaciones compactas de> 10,000 transcriptomas de cáncer primario. Estas representaciones se pueden decodificar de nuevo en todo el transcriptoma, y ​​nuestros hallazgos sugieren que capturan jerarquías biológicas dentro de los datos. Al analizar las representaciones decodificadas, encontramos que los genes asociados con la funcionalidad celular y la aparición y mantenimiento del cáncer están altamente correlacionados con sus valores de RPKM de entrada escalados, mientras que los ARN cortos no codificantes, los miembros de la familia de proteínas asociadas a la queratina y un subconjunto de pseudogenes se reproducen con menos fidelidad. La aplicación inmediata de este método radica en identificar genes que están bajo un fuerte control transcripcional en un conjunto de muestras, y en generar representaciones comprimidas biológicamente significativas de todo el transcriptoma para su posterior análisis.

Resumen de la presentación: Show

La transcripción y el empalme alternativos crean una complejidad extraordinaria de transcriptomas y sientan las bases para la diversidad estructural y funcional de los proteomas de mamíferos. Presentamos evidencia de que la adquisición de nuevos exones en genes empalmados puede ocurrir por extensión en mosaico de dominios funcionales de genes, donde se pueden incorporar nuevos exones codificantes alternativos a lo largo de la evolución, preferentemente en los extremos de los CDS. Además, la adquisición de nuevos exones en los límites de CDS y UTR está mediada principalmente por eventos de transcripción alternativos, donde los extremos 5 'y 3' extendidos hacen contribuciones importantes a la diversidad de isoformas de proteínas. La transcripción alternativa hace una contribución cinco veces mayor a la diversidad del transcriptoma y proteoma humano que el empalme alternativo, específicamente para genes específicos de tejido y afección y su expresión. Nuestros resultados sugieren que el procesamiento diferencial de los extremos 5 'y 3' reflejan dos estrategias reguladoras a nivel de i) iniciación de la transcripción utilizando promotores variables y ii) regulación postranscripcional con variabilidad C-terminal de isoformas proteicas. Demostramos que durante la evolución, los dominios proteicos compactos suelen estar codificados por ARNm altamente estructurados, lo que sugiere que estructuras de ARNm alternativas podrían controlar el plegamiento de proteínas de isoformas alternativas. Se discutirá el papel de las isoformas alternativas como biomarcadores para estados patológicos.

  • Chen Yang, Centro de Ciencias del Genoma del Cáncer de BC, Canadá
  • Sabre Hafezqorani, Centro de Ciencias del Genoma del Cáncer de BC, Canadá
  • Ka Ming Nip, Centro de Ciencias del Genoma del Cáncer de BC, Canadá
  • Rene Warren, BC Cancer, Centro de Ciencias del Genoma, Canadá
  • Inanc Birol, Centro de Ciencias del Genoma del Cáncer de BC, Canadá

Resumen de la presentación: Show

En los últimos años, ha habido un crecimiento en el número de soluciones de ensamblaje de secuencias para datos de secuenciación de nanoporos. Estos métodos están diseñados para el ensamblaje del genoma y no funcionan bien con datos de RNA-seq, en todo caso. Los métodos existentes para el ensamblaje de transcriptomas con lecturas de secuencia de ARN de nanoporos están guiados por referencia o están destinados a ensamblar un híbrido de lecturas largas y cortas. Para llenar este vacío, presentamos un método de ensamblaje de novo que solo usa datos de secuenciación de ARN de nanoporos. En nuestro enfoque, las lecturas se corrigen primero en busca de errores y luego se estratifican por longitud y cobertura de k-mer. Luego, las lecturas con corrección de errores se recuperan de cada estrato para agruparlas en grupos de lecturas que pertenecen al mismo gen. Finalmente, las lecturas de cada grupo se ensamblan en isoformas de transcripción. Usando un conjunto de datos de transcriptoma de ratón simulado, mostramos que nuestro método fue capaz de corregir una proporción significativa de errores en las lecturas de nanoporos y luego ensamblar isoformas de longitud completa a partir de grupos de lecturas que representan predominantemente genes individuales. Dado que nuestro método no se basa en una referencia para la reconstrucción de la secuencia de la transcripción, sienta las bases para la transcriptómica comparativa a gran escala donde los ensamblajes de genoma en borrador de alta calidad no están fácilmente disponibles.

Resumen de la presentación: Show

Los protocolos de secuenciación profunda permiten la identificación a gran escala de los objetivos de los ARN reguladores no codificantes, así como de las proteínas de unión al ARN, y también permiten la elaboración de perfiles de diferentes pasos de la regulación génica, desde la transcripción incipiente hasta la traducción. Presentaré el trabajo en curso sobre la detección de la traducción a nivel de isoformas a partir de datos de perfiles de ribosomas, así como enfoques de aprendizaje profundo para identificar sitios de unión funcionales y sus características a partir de compendios de reticulación e inmunoprecipitación.

  • Runxuan Zhang, The James Hutton Institute, Reino Unido
  • Wenbin Guo, Universidad de Dundee, Reino Unido
  • Cristiane Calixto, Universidad de Dundee, Brasil
  • Allan James, Universidad de Glasgow, Reino Unido
  • Hugh Nimmo, Universidad de Glasgow, Reino Unido
  • John Brown, Universidad de Dundee, Reino Unido

Resumen de la presentación: Show

Comprender las limitaciones actuales de RNA-seq es crucial para un análisis de expresión confiable. Hemos desarrollado:
1) Nuevos métodos para construir referencias de transcripciones de alta calidad utilizando datos de RNA-seq (Zhang et al.2017 NAR) e Iso-seq. Las referencias de transcripciones completas y precisas garantizan la precisión de la cuantificación de la transcripción, que sustenta la investigación sobre la regulación postranscripcional (AS, APA, traducción, etc.).
2) Una tubería de vanguardia (3D RNA-seq) que detecta la expresión genética diferencial, el empalme alternativo y el uso de transcripciones. Permite el análisis simple y rápido de expresión / AS de experimentos de RNA-seq por biólogos sin conocimientos de programación (https://github.com/wyguo/ThreeDRNAseq).
3) Una aplicación brillante (TSIS) (Guo et al. 2017 Bioinformatics) para detectar y caracterizar cambios de isoformas de transcripción significativos para RNA-seq de series de tiempo.
4) Herramientas que identifican con precisión marcos de lectura abiertos (ORF) que evitan la anotación errónea de los ORF que se encuentran en muchas bases de datos (Brown et al.2015 Plant Cell) (Transfix) y caracterizan las transcripciones que codifican variantes de proteínas, eventos AS, codones de terminación prematura y sin sentido. características de desintegración mediadas (Transfeature).

Estas herramientas / métodos permitieron la investigación a gran escala de la expresión / AS en una serie de tiempo fría en Arabidopsis que muestra una respuesta AS masiva y rápida e identifica nuevos factores de transcripción y empalme sensibles al frío regulados solo por AS (Calixto et al.2018 Plant Cell ).

  • Stefan Mautner, Albert-Ludwigs-University Freiburg, Alemania
  • Soheila Montaseri, Albert-Ludwigs-University Freiburg, Irán
  • Milad Miladi, Universidad de Friburgo, Alemania
  • Martin Mann, Universidad de Friburgo, Alemania
  • Fabrizio Costa, Universidad de Exeter, Reino Unido
  • Rolf Backofen, Albert-Ludwigs-University Freiburg, Alemania

Resumen de la presentación: Show

Los experimentos SHAPE se utilizan para sondear la estructura de moléculas de ARN.
Presentamos ShaKer para predecir los datos de SHAPE para ARN mediante un enfoque de aprendizaje automático basado en kernel de gráficos que se entrena con información de SHAPE experimental.
Mientras que otros métodos disponibles requieren una estructura de referencia seleccionada manualmente, ShaKer predice los datos de reactividad basándose únicamente en la entrada de secuencia y muestreando el conjunto de estructuras posibles.
Por lo tanto, ShaKer está bien situado para permitir la predicción de datos SHAPE de todo el transcriptoma impulsada por experimentos para permitir el estudio de la estructura del ARN y mejorar la estructura del ARN y la predicción de la interacción ARN-ARN.

Para la evaluación del desempeño utilizamos precisión y accesibilidad en comparación con los datos experimentales de SHAPE y los métodos de la competencia. Podemos demostrar que Shaker supera a sus competidores y es capaz de predecir anotaciones SHAPE de alta calidad incluso cuando no se proporciona una estructura de referencia.

  • Zichao Yan, Universidad McGill, Canadá
  • Eric Lécuyer, Institut de Recherche Clinique de Montréal, Canadá
  • Mathieu Blanchette, Universidad McGill, Canadá

Resumen de la presentación: Show

Motivación: Los mecanismos de localización subcelular del ARN mensajero juegan un papel crucial en la regulación génica postranscripcional. Este tráfico está mediado por proteínas de unión a ARN que actúan en trans y que interactúan con elementos reguladores en cis denominados códigos postales. Si bien las nuevas tecnologías basadas en secuenciación permiten la identificación de alto rendimiento de ARN localizados en compartimentos subcelulares específicos, los mecanismos precisos en juego y su dependencia de elementos de secuencia específicos siguen siendo poco conocidos.
Resultados: Presentamos RNATracker, una nueva red neuronal profunda construida para predecir, solo a partir de su secuencia, las distribuciones de las transcripciones de ARNm en un conjunto predefinido de compartimentos subcelulares. RNATracker integra varias técnicas de aprendizaje profundo de vanguardia (por ejemplo, CNN, LSTM y capas de atención) y puede hacer uso de información de secuencia y estructura secundaria. Informamos sobre una variedad de evaluaciones que muestran el fuerte poder predictivo de RNATracker, que es significativamente superior a una variedad de predictores de línea de base. A pesar de su complejidad, se pueden aislar varios aspectos del modelo para producir hipótesis mecánicas valiosas y comprobables, y para localizar secuencias de códigos postales candidatas dentro de las transcripciones.
Disponibilidad: se puede acceder al código y los datos en https://www.github.com/HarveyYan/RNATracker

  • Francisco Pardo Palacios, Centro de Investigación Príncipe Felipe (CIPF), España
  • Lorena de La Fuente Lorente, Centro de Investigación Príncipe Felipe (CIPF), España
  • Pedro Salguero, Centro de Investigación Príncipe Felipe (CIPF), España
  • Cristina Marti, CIPF, España
  • Manuel Tardaguila, Sanger Institute, Reino Unido
  • Héctor del Risco, Universidad de Florida, Estados Unidos
  • Ana Conesa, Universidad de Floria, Estados Unidos

Resumen de la presentación: Show

Los mecanismos postranscripcionales como el empalme alternativo (AS) y la poliadenilación alternativa (APA) regulan la maduración de las moléculas de pre-ARNm y pueden dar como resultado diferentes transcripciones que surgen del mismo gen. AS y APA aumentan la diversidad y la capacidad de regulación de transcriptomas y proteomas. AS y APA se han caracterizado ampliamente a nivel mecanicista, pero en menor medida en términos de impacto funcional. Faltan herramientas fáciles de usar para la creación de perfiles funcionales en la resolución de isoformas, lo que limita nuestra capacidad para investigar las consecuencias funcionales de la maduración del ARN postranscripcional. Hemos desarrollado un marco de análisis novedoso para la iso-transcriptómica funcional que consiste en una tubería para la anotación funcional resuelta por isoformas ( IsoAnnot) y un software fácil de usar para analizar el impacto potencial de AS y APA (tappAS). IsoAnnot incorpora más de 15 bases de datos funcionales, mientras que tappAS implementa algoritmos novedosos para interrogar la interacción entre AS y función. Aplicamos estos métodos para caracterizar el iso-transcriptoma en diferenciación neuronal y en tejidos vegetales. Nuestro marco de análisis revela los motivos funcionales incluidos diferencialmente en las isoformas para regular la función de procesos biológicos específicos y ofrece nuevos lugares para investigar las consecuencias funcionales de la regulación postranscripcional.

  • Barry Slaff, Universidad de Pensilvania, Estados Unidos
  • Yoseph Barash, Universidad de Pensilvania, Estados Unidos

Resumen de la presentación: Show

ANTECEDENTES
Se ha prestado mucha atención a la corrección de factores de confusión al estudiar la expresión génica. Sorprendentemente, no existen métodos equivalentes para el análisis de empalme de ARN. Por lo tanto, existe una gran necesidad de un método que se integre con las herramientas de empalme existentes, escale a conjuntos de datos con miles de muestras y millones de uniones, y produzca recuentos ajustados que permitan una mayor comprensión de los análisis exploratorios y las pruebas de empalme diferencial.

RESULTADOS
Desarrollamos MOCCASIN, un método de ajuste de factor de confusión de empalme. El método puede corregir factores de confusión conocidos y desconocidos, escala a conjuntos de datos muy grandes y produce recuentos ajustados que se pueden integrar con herramientas de visualización y cuantificación de empalmes como MAJIQ. Usando RNASeq de cientos de muestras de cáncer (AML, ALL), demostramos la efectividad de MOCCASIN y mostramos que se compara favorablemente con un procedimiento usado recientemente por ENCODE para empalmar datos. Mostramos que las cuantificaciones de empalme corregidas mejoran la señal de las señales conocidas (tratamiento) y desconocidas (género).

CONCLUSIONES
MOCCASIN es el primer método de corrección de factores de confusión integrado con el software de análisis y cuantificación de empalmes (MAJIQ). El método elimina con éxito la variación de los factores de confusión conocidos y desconocidos, reduce los falsos positivos en el análisis de empalme diferencial y escala a conjuntos de datos de secuencia de ARN a nivel de consorcio como TCGA y GTEX.

Resumen de la presentación: Show

La especificación del tipo celular se ha atribuido principalmente a la epigenética.

y regulación transcripcional. Sin embargo, la regulación de la traducción es

prominente en el desarrollo temprano y varios estudios recientes han vinculado

alteraciones en la síntesis de proteínas a cambios en la célula

funcionalidad. Además, se está acumulando evidencia de que el ribosoma

Las variantes contribuyen a los programas de genes específicos del tipo celular.

expresión. En esta charla me gustaría presentar nuestros esfuerzos en

caracterizar la regulación de la traducción de ARNm en relación con

estados celulares, desde la levadura hasta el hombre. Describiré nuestro trabajo en

inferir los determinantes de las tasas de síntesis de proteínas en la levadura, así como

la relación entre la capacidad de síntesis de proteínas y la vida útil. I

También discutiremos aspectos de la regulación de la traducción en mamíferos.

sistema, específicamente en relación con el tipo de célula y la tasa de proliferación

  • Rukeia El-Athman, Instituto de Biología Teórica, Universidad Humboldt de Berlín y Universidad Médica Charité de Berlín, Alemania

Resumen de la presentación: Show

Cada vez hay más pruebas que apuntan a un papel del reloj circadiano en la regulación temporal del empalme de pre-ARNm. Para investigar si el mismo gen puede dar lugar a transcripciones con patrones oscilatorios divergentes, analizamos los ritmos transcripcionales circadianos y ultradianos de isoformas individuales y los comparamos con los observados a nivel genético en 12 tejidos de ratón y 64 de babuino oliva. Encontramos varios genes relacionados con el empalme con una actividad transcripcional rítmica constante de 24 horas en tejidos y especies que mostraban una distribución de fase bimodal.Además, identificamos eventos de empalme alternativo putativo rítmico de 24 y 12 horas en tejidos murinos y pares de isoformas de empalme rítmico diferencialmente de 24 y 12 horas del mismo gen en tejidos de babuino cuya expresión alcanzó su punto máximo en momentos opuestos del día. Varios de los genes candidatos se asociaron con procesos de empalme de ARNm, lo que sugiere una interacción recíproca entre la ritmicidad circadiana observada de los genes relacionados con el empalme y la producción de isoformas dependiente de la hora del día. Ampliamos nuestros hallazgos analizando un nuevo conjunto de datos de dos líneas celulares de cáncer colorrectal en diferentes etapas de progresión del mismo paciente. Ambos mostraron isoformas rítmicas de fase desplazada de 24 hy 12 h que diferían entre el tumor primario y la línea celular metastásica, lo que apunta a un papel del empalme alternativo rítmico en la progresión del tumor.

Resumen de la presentación: Show

Recientemente publicamos distintos métodos de isoforma de lectura larga, que incluyen a) secuenciación de ARN de isoforma de una sola célula (ScISOr-Seq) 1 yb) secuenciación de ARN sintético de lectura larga (SLR-RNA-Seq) 2. ScISOr-Seq opera en suspensiones unicelulares de tejido a granel, emplea secuenciación de 3 extremos para determinar el tipo de célula de cada célula individual y luego secuenciación de isoformas (PacBio u Oxford Nanopore) para determinar las isoformas completas de células individuales y poblaciones de células. SLR-RNA-seq determina secuencias de longitud completa de millones de moléculas individuales utilizando una secuenciación profunda de lectura corta de muy pocas moléculas (que estadísticamente casi con certeza se originan a partir de diferentes genes) a la vez. Es importante destacar que SLR-RNA-seq puede funcionar con menos de 1 nanogramo de material, por lo que requiere mucho menos PCR. A continuación, describiré aplicaciones inéditas de estas tecnologías en el cerebro de los mamíferos. Informaré sobre la coordinación de eventos de procesamiento de ARN que no involucran sitios de empalme de ARN, en células individuales, líneas celulares y tipos de células del sistema nervioso central. Además, nuestros conjuntos de datos más nuevos revelan un orden de magnitud más patrones de expresión de isoformas específicos de tipo celular que nuestros conjuntos de datos anteriores. Por lo tanto, las isoformas específicas de tipo celular serán un tema que se abordará más fácilmente en un futuro próximo.

1. Gupta *, Collier * et al., Nature Biotechnol, 2018
2. Tilgner *, Jahanbani * et al. Nature Biotechnol, 2015

  • Ángeles Arzalluz-Luque, Universitat Politècnica de València, España
  • Sonia Tarazona, Universitat Politècnica de València, España
  • Ana Conesa, Universidad de Florida, Estados Unidos

Resumen de la presentación: Show

Los estudios de RNAseq unicelulares se han centrado principalmente en el descubrimiento y caracterización de nuevos tipos de células, dejando áreas como la dinámica de expresión de isoformas sin explorar. En este estudio, desarrollamos la primera canalización para inferir relaciones de coexpresión entre módulos de isoformas de longitud completa utilizando datos de una sola célula y exploramos las implicaciones biológicas del empalme alternativo como un mecanismo coordinado que cambia las propiedades de la transcripción y la proteína simultáneamente dependiendo de la tipo de célula. Además, nuestra tubería supera tres limitaciones principales de análisis anteriores: (1) evaluación de expresión diferencial y empalme diferencial en múltiples grupos, evitando comparaciones por pares, (2) nueva medida de correlación que reduce las interferencias de ruido y abandonos en métricas tradicionales, capturando con éxito co -relaciones de expresión, y (3) análisis de múltiples grupos de genes con uso de co-isoformas, mediante la agrupación de transcripciones con perfiles de expresión similares en todos los grupos. Al observar conjuntos de genes cuyas isoformas se asignan a diferentes grupos, demostramos que el empalme actúa de manera coordinada para aumentar la longitud de 3'UTR y la expresión de los motivos de unión de miARN y RBP asociados en células neurales frente a células gliales, así como para promover la inclusión de exones. que codifican dominios de proteínas específicos en neuronas, y proponen un papel para el corte y empalme diferencial de estos genes en la remodelación del citoesqueleto y el transporte de vesículas.

  • Shalom Hillel Roth, Facultad de Ciencias de la Vida Mina y Everard Goodman, Universidad Bar-Ilan, Israel
  • Erez Y. Levanon, Facultad de Ciencias de la Vida Mina y Everard Goodman, Universidad Bar-Ilan, Israel
  • Eli Eisenberg, Escuela de Física y Astronomía Raymond y Beverly Sackler y Escuela de Neurociencia Sagol, Universidad de Tel Aviv, Israel

Resumen de la presentación: Show

Resumen de la presentación: Show

Más de la mitad de los genes humanos ejercen la poliadenilación alternativa (APA) para generar diferentes transcripciones de ARNm. La creciente importancia de APA en el contexto de la enfermedad impulsó el desarrollo de varias técnicas de secuenciación 3 '. A pesar de esto, no existen herramientas computacionales diseñadas precisamente para datos de 3 segundos. Aquí presentamos PolyA-miner, un novedoso algoritmo alternativo de cuantificación de poliadenilación basado en factorización de matriz no negativa (NMF). Un gen se extrae como una matriz de sitios de poliadenilación y se ejecuta un NMF de consenso iterativo para extraer una dicotomización robusta de muestras. La significancia estadística se evalúa como la bondad de ajuste de la dicotomización sobre un modelo nulo. Evaluamos PolyA-miner en los datos de la línea celular de glioblastoma PAC-seq. Sorprendentemente, se identifican 1418 genes con cambios en APA en contraste con 695 genes informados en el estudio original. Además, se identifican 157 genes con nuevos sitios de poliadenilación. PolyA-miner es la primera herramienta computacional diseñada específicamente para datos 3’Seq. El consenso iterativo NMF lo hace menos susceptible a la variación de la muestra. Puede identificar eficazmente nuevos sitios de APA y tener en cuenta todos los cambios de APA, incluidos los cambios no proximales a no distales. Con la importancia emergente de la APA en las enfermedades humanas, PolyA-miner puede acelerar significativamente el análisis y ayudar a decodificar las piezas faltantes de la dinámica subyacente de la APA.


Parte II: La percepción

H: A finales de la década de 1920 y principios de la de 1930, los matemáticos y los lógicos se estaban volviendo profundamente filosóficos. Estaban haciendo preguntas como & # 8220 ¿podemos idear un algoritmo para decidir si una declaración determinada puede probarse como cierta? & # 8221. O & # 8220¿Hay algunos números que se pueden definir pero no calcular? & # 8221. O & # 8220 ¿podemos pensar en un sistema para construir funciones que sea lo suficientemente general como para incluir todas las funciones calculables? & # 8221. Hubo un intento concertado de formalizar la noción de & # 8220computación & # 8221.

De esa época surgieron tres enfoques que se desarrollaron de forma independiente: 1) lógica combinatoria y cálculo lambda, 2) funciones recursivas generales y 3) máquinas de Turing y modelo Post & # 8217s. Al final, estos tres intentos en competencia de formalizar la noción de computación resultaron ser equivalentes. Al principio no era obvio. De hecho, les tomó años darse cuenta de esto. Los tres sistemas son igualmente poderosos. Cada uno puede usarse para simular otro.

Esto llevó a la gente a la idea de que habían encontrado el límite de la computabilidad. Es común enunciar esta idea en términos de máquinas de Turing: & # 8220 las máquinas de Turing son capaces de calcular cualquier función computable & # 8221, que es esencialmente lo que dice la tesis de Church-Turing. Pero puede reemplazar & # 8220Turing machine & # 8221 con cualquiera de los otros sistemas. Por ejemplo, el cálculo lambda es capaz de calcular cualquier función computable.

S: Esa es la razón por la que sigues mencionando las máquinas de Turing.

H: ¡Sí! Y ahora puede ver que las máquinas de Turing no son realmente tan especiales. Son solo uno de los muchos sistemas de computación universales. Cuando lo menciono, puedes reemplazarlo con cualquier otro sistema equivalente, incluso con tu lenguaje de programación favorito. Porque cualquier cosa que pueda simular una máquina de Turing también es capaz de calcular cualquier función computable.

S: Entonces, si lo entiendo correctamente, hay algo llamado la tesis de Church-Turing que dice que las máquinas de Turing pueden calcular cualquier cosa que posiblemente se pueda calcular. Y puedo reemplazar & # 8220Turing machine & # 8221 con & # 8220Python & # 8221 o & # 8220javascript & # 8221 y todavía es cierto.

S: ¿Es esto un hecho probado?

H: Bueno, aquí es donde se vuelve un poco misterioso. El problema de probar la tesis de Church-Turing es que no está del todo bien definida. Tienes que demostrar que las máquinas de Turing pueden calcular cualquier cosa que sea computable. Pero, ¿qué significa que algo sea & # 8220computable & # 8221? El objetivo de crear las máquinas de Turing fue formalizar lo que significa computar.

S: ¡Así que es una definición! La tesis de Church-Turing simplemente define lo que significa ser computable. ¿Derecha?

H: Algunas personas parecen pensar que es solo una definición. Yo no & # 8217t. Creo que está afirmando algo sustancial. Una definición no es algo que sea verdadero o falso. Pero esta es una afirmación que, en principio, puede ser refutada.

S: Todavía no lo entiendo. Entonces, ¿es la tesis de Church-Turing una declaración empírica? ¿O es una declaración matemática?

H: No está claro. Desde el principio ha habido diferentes interpretaciones. Gödel sugirió que se puede probar a partir de un conjunto de axiomas que definen & # 8220 efectivamente calculable & # 8221. De hecho, Nachum Dershowitz y Yuri Gurevich lo demostraron en 2008.

S: Entonces ahí es ¿Una prueba de la tesis de Church-Turing?

H: Sí, pero siempre puedes estar en desacuerdo con los axiomas que eligieron para esa prueba. Alguien puede decir que su definición de computación no era lo suficientemente general como para abarcar todo tipo de computación. Por ejemplo, sus axiomas permitían cálculos analógicos y números reales, pero todo aún tiene que suceder en pasos discretos. La computación tiene que ser algorítmica según sus axiomas.

S: Eso & # 8217s nos lleva a algo que quería decir, en realidad. En la vista clásica, la computación es algo algorítmico & # 8211 que ocurre en pasos de tiempo discretos. Y puede haber otras suposiciones sobre lo que significa computar que no necesariamente se apliquen al mundo natural.

H: Entonces, consideremos solamente la interpretación empírica de la tesis de Church-Turing. Si me muestra un sistema biológico o físico que puede calcular cosas que las máquinas de Turing no pueden, diremos que hemos refutado la tesis de Church-Turing. Se permiten cálculos no algorítmicos no discretos. Hasta ahora nadie ha hecho esto.

S: Supongo que tendré que creer en tu palabra. Pero todavía me molesta todo este enfoque. Está imponiendo un marco en un área donde podría no ser aplicable. La naturaleza hace cosas que no se pueden definir bien. No es matemática o informática donde tiene una clara separación de entradas y salidas. Quiero decir, ¿cuáles son las entradas y salidas de mi gato? ¿Qué es exactamente la informática? ¿Computa una secuoya? ¿Qué pasa con una roca que absorbe la luz solar y emite rayos y cambia de forma con los años de meteorización?

H: Excelentes preguntas. Esto es lo que estoy afirmando: puedes elegir el sistema y puedes elegir las entradas y salidas. Siempre que su sistema sea realista, cualquier cosa que su sistema pueda usar para computar, las máquinas de Turing también pueden computar. No me importa si su sistema es analógico, probabilístico o continuo en el tiempo. No se puede trascender el poder de las máquinas de Turing a menos que la tesis de Church-Turing esté equivocada (al menos la interpretación física / empírica de la tesis).

S: Pero mi punto es que a veces es posible que no podamos definir las entradas y salidas y especificar cómo están relacionadas. Por ejemplo, la factorización de enteros es un problema de cálculo bien definido. La entrada es un solo número y la salida es una serie de números, determinables de forma única a partir de la entrada. Pero si estamos hablando de biología, bueno, ¿cuál es el mapeo de entrada a salida que resuelve un gato?

Quizás pueda decir que las entradas provienen de sus órganos sensoriales y sus salidas son comandos motores. Pero, ¿de qué intervalo de tiempo estamos hablando? ¿Estamos hablando de mapear estímulos sensoriales instantáneos a comandos motores inmediatos? Seguramente, los gatos no pueden ser modelados de esa manera, un gato puede hacer cosas diferentes en la misma situación sensorial exacta. Por lo tanto, la entrada instantánea no se puede asignar a una salida única porque un gato puede usar la memoria de experiencias pasadas para influir en la toma de decisiones. En el otro extremo, se podría decir que el gato asigna una vida de estímulos de entrada a una vida de comandos motores para maximizar la supervivencia o la reproducción. Pero este no es el marco predefinido de entrada a salida que es típico en la teoría de la computación. La mayoría de las entradas sensoriales de un gato son el resultado de sus decisiones anteriores. Las acciones de un gato dan forma a sus entradas sensoriales. Y las entradas sensoriales junto con un recuerdo de experiencias pasadas se utilizan para guiar sus próximas acciones. Hay & # 8217s un circuito de retroalimentación constante entre entradas y salidas. Mientras que, en la factorización de enteros, es solo un mapeo predefinido sencillo.

H: Levanta muy buenos puntos. Así es como yo lo veo. No es que el gato en su conjunto esté resolviendo un mapeo de entrada / salida específico. Más bien, es que el gato contiene uno o más sistemas computacionales que pueden usarse para resolver varios problemas cuando surjan.

Una analogía que puede que no le guste, pero que creo que será útil de todos modos es un teléfono inteligente. ¿Qué relación de entrada / salida resuelve su teléfono? Los mismos problemas que planteó sobre las experiencias pasadas y los circuitos de retroalimentación de entrada / salida también se aplican a los dispositivos informáticos como los teléfonos inteligentes. Es realmente difícil describir a los teléfonos inteligentes como una solución única de mapeo de entrada a salida. Pero su teléfono inteligente contiene muchas aplicaciones, cada una de las cuales contiene muchos módulos y funciones. Un módulo es responsable de dibujar imágenes en la pantalla, otro puede ser responsable de convertir la información en paquetes para enviar a través de la red. En ese nivel, las relaciones de entrada a salida pueden estar bien definidas.

Del mismo modo, el comportamiento de un gato se puede descomponer en tareas simples y problemas de cálculo. Las personas caracterizan y estudian estos componentes más pequeños en el campo del comportamiento animal. Mi ejemplo favorito actual es la integración de caminos: saber dónde estás en el espacio integrando pequeños movimientos. Es un problema de cálculo bien definido, ¡casi tan bien definido como la factorización de enteros! Las entradas para el cálculo (orientación y velocidad) tienen que provenir de otros módulos de cálculo y la salida (posición en el espacio) se puede utilizar para todo tipo de cosas diferentes.

S: De acuerdo, pero incluso si logramos descomponer el comportamiento animal en componentes y módulos más pequeños, las funciones no están necesariamente definidas tan claramente como lo están para, digamos, la integración de rutas. En la integración de ruta hay una única respuesta correcta. Pero cuando un animal está buscando pareja o huyendo de un depredador, no existe una única respuesta correcta. Puede haber muchas respuestas correctas y el animal puede simplemente tomar una decisión que sea lo suficientemente buena. La concepción clásica de la computación, con asignaciones fijas de entrada a salida, no es adecuada para este tipo de problemas.

H: No estoy de acuerdo. En la práctica, muchos algoritmos son heurísticos o aproximaciones que encuentran una respuesta que es suficientemente bueno. Y muy a menudo los programas de computadora utilizan generadores aleatorios para producir resultados que son variables y no siempre únicos.

Creo que siempre se pueden formular problemas de cálculo como asignaciones clásicas de entrada a salida. Un problema que tiene más de una salida correcta puede reformularse como un problema de decisión que verifica si una salida candidata es correcta o & # 8220 suficientemente buena & # 8221.

S: Su afirmación es que las máquinas de Turing son este último sistema informático extremadamente poderoso que puede resolver cualquier cosa que pueda resolverse, incluidos todos los problemas que surgen en biología. ¿A dónde vas con esto?

H: Bien. Ser capaz de resolver todos los problemas computables se denomina & # 8220cálculo universal & # 8221. Pero permítanme volver a enfatizar que no son solo las máquinas de Turing las que son universales. Existen numerosos sistemas que también son universales. Se requiere muy poco para lograr la computación universal. Casi todos los lenguajes de programación lo logran, incluso aquellos con componentes ridículamente mínimos. Algunos sistemas lo han tropezado accidentalmente. Por ejemplo, la regla 110 de Wofram & # 8217 o el juego de la vida de Conway & # 8217 no pretendían ser sistemas de cálculo potentes. Pero con reglas muy simples, son capaces de calcular cualquier función computable (es decir, equivalente de Turing). Así que no es que las máquinas de Turing sean computadoras extraordinariamente poderosas. Es & # 8217s que los sistemas dinámicos y las redes neuronales son patéticamente débiles.

S: ¿Patéticamente débil? Eso suena injusto. ¿Qué pasa con todo el éxito reciente que hemos tenido con las redes neuronales profundas? ¡Las redes neuronales pueden vencer a los humanos en juegos como Go y Starcraft!

H: ¿Y en qué funcionan estas redes profundas? ¿No son programas de computadora que se ejecutan en computadoras digitales?

S: Sí, pero también se pueden implementar con redes de neuronas.

H: Quizás puedan. Pero actualmente estamos usando computadoras digitales y lenguajes de programación para entrenarlos y ejecutarlos, no circuitos analógicos o redes de neuronas. Creo que eso da fe de la generalidad de los sistemas equivalentes de Turing. Tenga en cuenta que Go y Starcraft son ejemplos en los que no hay un movimiento exclusivamente correcto. Acaba de criticar el marco clásico de la teoría de la computación por no poder abordar este tipo de problemas. ¿Recordar? ¡Pues aquí tenemos programas que están jugando! ¿No es fascinante que todavía estemos usando las mismas operaciones de CPU y arquitectura para esto? La equivalencia de Turing es todo lo que necesita. Los sistemas dinámicos, por otro lado, ni siquiera pueden hacer lo que pueden hacer los lenguajes de programación más simples.

S: Debe ser un poco más concreto sobre la debilidad de los sistemas dinámicos. Le pedí un ejemplo de algo que no puedan & # 8217t calcular, y usted dijo que no pueden & # 8217t simular máquinas de Turing o ejecutar programas de computadora. Pero ese no es un ejemplo muy convincente.

H: Bueno, para ser honesto, es difícil para mí darte más ejemplos de los que estoy 100% seguro. Pero puedo darte ejemplos de cosas que sospechar los sistemas dinámicos son realmente incapaces de hacerlo. Aquí & # 8217s uno: dada una cadena de paréntesis abiertos y cerrados, p. Ej. & # 8220 (() (())) () & # 8221, devuelve su profundidad máxima.

¡O aquí & # 8217s todavía más sencillo! Dada una cadena de Xarena Os, determine si el número de Xs es igual al número de Os.

S: ¿De verdad? Me cuesta creer que los sistemas dinámicos sean incapaces de resolver este problema. Es básicamente un problema de conteo.

H: Sí. Sospecho que no se puede hacer que los sistemas dinámicos cuenten hasta números arbitrariamente grandes. Ciertamente puede crear un sistema dinámico que funcione para tamaños de entrada de hasta, digamos, 50 o 100 caracteres de Xarena Os. Pero siempre habrá un límite en cuanto a lo alto que puede contar su sistema dinámico.

S: Cualquier sistema físico tendrá esa limitación. Su computadora tiene memoria limitada, por lo que también tiene un límite en la cantidad de un número que se puede almacenar en ella. ¡No puede contar hasta el infinito!

H: Está confundido de nuevo acerca de la distinción entre dispositivos informáticos y programas informáticos. Es el programa de computadora (y también la arquitectura de la computadora) que es equivalente a Turing. Puedo escribir un programa que cuente Xarena Os hasta números arbitrariamente grandes. Si lo ejecuta con una entrada enorme y se queda sin memoria o baterías, esa & # 8217 es una limitación que proviene de su dispositivo informático & # 8211, no de mi programa. Luego puede tomar el mismo programa y ejecutarlo en otra computadora con memoria lo suficientemente grande y funcionará. El punto crucial es que funcionará con más recursos. sin cambiar el código.

Por otro lado, no hay descripción de un sistema dinámico que pueda contar arbitrariamente alto. Puede describir un sistema dinámico que cuenta hasta un número muy grande. Pero si doy una entrada que excede ese límite, tendrá que rediseñar su sistema dinámico. La descripción de su sistema dinámico tendrá que cambiar para tratar con entradas más grandes.

Está bien. Pero puedo argumentar que los sistemas biológicos no necesitan contar hasta números arbitrariamente grandes.

H: ¡Tampoco los programas de computadora para todos nuestros propósitos prácticos! Pero todavía utilizamos sistemas de computación universales en tecnología.

S: Pero, ¿qué es algo que la biología absolutamente necesidades computación universal para? Parece que la computación universal no es necesaria si el tamaño de entrada está restringido.

H: Si el tamaño máximo de entrada de un problema está predeterminado, puede resolver ese problema incluso con una tabla de búsqueda & # 8211, que es mucho más débil que un sistema dinámico. Pero hay muchos problemas de computación en biología donde el tamaño de entrada no está predeterminado.

S: ¿Cómo qué?

H: Oh, puedo pensar en muchos ejemplos, desde el reconocimiento de voz humano hasta la integración de la ruta de los insectos.

S: Pero hay un límite en cuanto a la duración de una oración en la práctica o la distancia que camina un insecto.

H: Sí, supongo que tienes razón. Pero es mucho más sencillo describir una solución a esos problemas que no tiene en cuenta ese límite.

Es como decir que no necesitamos un algoritmo para la división, porque simplemente puede memorizar una tabla de división muy grande. Según su lógica, hay un límite para el conjunto de números que los humanos encontrarán, por lo que podemos reemplazar todas las matemáticas con tablas de búsqueda. El problema es que las descripciones se vuelven excesivamente largas y complicadas si quieres resolver problemas de esta manera.

Debe dejar de pensar en la computación universal como este nivel sofisticado de poder de computación que no evolucionaría a menos que sea necesario. Es más bien un nivel de cálculo muy accesible que se puede alcanzar & # 8211 a menudo accidentalmente & # 8211 mediante la implementación de reglas poco sofisticadas.

Permítame hacerle una pregunta. ¿Crees que los coches necesitan una computadora universal para funcionar?

S: Probablemente no. Los coches se inventaron mucho antes que las computadoras.

H: De hecho. En principio, los automóviles no requieren un sistema de cálculo universal para funcionar. Pero entonces, ¿por qué los coches modernos tienen decenas de microprocesadores? (Los microprocesadores se basan en la arquitectura von Neumann y el equivalente de Turing). Estoy hablando de cosas como controlar el motor y los frenos. Eso es todo hecho con microprocesadores en estos días. De hecho, tenemos microprocesadores en casi todos los dispositivos modernos, incluidas máquinas de café, termostatos, juguetes, lavadoras. Los microprocesadores están reemplazando las soluciones de circuitos analógicos más antiguos. No porque estos dispositivos necesiten estrictamente computadoras universales para funcionar, sino porque las computadoras universales son suficientes. En la mayoría de situaciones, es la forma más sencilla y eficiente de calcular.

S: Veo tu punto. Aunque desconfío de generalizar lo que funciona para la tecnología humana a lo que funciona para la biología. Mi intuición es que los sistemas dinámicos son un sistema de cálculo más desordenado pero más natural. Mientras hagan el trabajo, la naturaleza no desarrollará una computadora universal.

H: No estás solo. Creo que así es como piensan la mayoría de los biólogos. Mi intuición, sin embargo, es que es extremadamente improbable que la naturaleza no se haya topado con un sistema de cálculo universal. Y una vez que se encuentre un sistema de este tipo, se extenderá y se utilizará para casi todo lo que implique la computación.


Máquinas de Turing ribosomales, cálculo de ADN / ARN - Biología

Intereses de investigación:
El laboratorio desarrolla algoritmos de aprendizaje automático que integran datos de alto rendimiento (RNASeq, CLIPSeq, PIPSeq, etc.) para inferir la biogénesis y la función del ARN, seguidos de verificaciones experimentales de los mecanismos inferidos.

Palabras clave:
Aprendizaje automático, modelos gráficos probabilísticos, biología computacional, empalme de ARN, regulación postranscripcional, genómica, análisis de secuenciación de alto rendimiento.

Publicaciones Seleccionadas

Vaquero-García J., Barrera A., Gazzara, M. González-Vallinas J., Lahens N., Hogenesch J., Lynch K., Barash Y.: Una nueva visión de la complejidad y la regulación del transcriptoma a través de la lente de las variaciones de empalme local. ELife 5: e11752, febrero de 2016.

Sotillo E., Barrett D., Black K., Bagashev A., Oldridge D., Wu G., Sussman R., Lanauze C., Gazzara M, Martinez N., Ruella M., Harrington C., Chung E. , Perazzelli J., Hofmann T., Maude S., Raman P., Barrera A., Gill S., Lacey S., Melenhorst J., Allman D., Jacoby E., Fry T., Mackall C., Barash Y., Lynch K., Maris J, Grupp S., Thomas-Tikhonenko A.: La convergencia de mutaciones adquiridas y el empalme alternativo de CD19 permite la resistencia a la inmunoterapia CART-19. Cancer Discovery 5 (12): 1282-95, diciembre de 2015 Notas: Contribución: El laboratorio del Dr. Barash detectó variaciones de empalme novedosas en los pacientes RNASeq, regulador de empalme previsto utilizando los algoritmos del laboratorio. Esto condujo al resultado principal de identificar la expresión de SRFS3 como promotor del escape y la recaída de CART19.

Martínez N, Agosto L., Qiu J., Mallory M., Gazarra M., Barash Y., Fu X., Lynch K. : El empalme alternativo generalizado dependiente de JNK induce un bucle de retroalimentación positiva a través de la regulación de MKK7 mediada por CELF2 durante la activación de las células T. Genes & Development 29 (19), 2015 Notas: Contribución: El Dr. Barash dirigió el análisis amplio del genoma de la señalización JNK y la corregulación CELF2 del empalme alternativo en T-Cell.

Xiong Hui Y, Alipanahi Babak, Lee Leo J, Bretschneider Hannes, Merico Daniele, Yuen Ryan KC, Hua Yimin, Gueroussov Serge, Najafabadi Hamed S, Hughes Timothy R, Morris Quaid, Barash Yoseph, Krainer Adrian R, Jojic Nebojsa, Scherer Stephen W, Blencowe Benjamin J, Frey Brendan J: El código de empalme humano revela nuevos conocimientos sobre los determinantes genéticos de la enfermedad. Science 347 (6218): 1254806, enero de 2015 Notas: El algoritmo de predicción y la canalización de análisis se desarrollaron con la ayuda del Dr. Barash y su código.

Yoseph Barash, Jorge Vaquero-Garcia, Juan González-Vallinas, Hui Yuan Xiong, Weijun Gao, Leo J Lee y Brendan J Frey: AVISPA: una herramienta web para la predicción y análisis de empalmes alternativos. Genome Biology 14 (10), 2013 Notas: Todo el trabajo fue realizado por el laboratorio Barash. Único autor correspondiente. El proyecto se inició como un postdoctorado y el miembro del laboratorio de Frey ayudó con el conjunto de datos y el algoritmo preliminares.

Gazzara Matthew R, Vaquero-García Jorge, Lynch Kristen W, Barash Yoseph: Análisis de empalme in silico a in vivo utilizando modelos de código de empalme. Methods (San Diego, California) 67 (1): 3-12, mayo de 2014.

Barash, Y., Blencowe, B. J., Frey, B. J.: Detección basada en modelos de señales de empalme alternativas. Bioinformática 26 (12): i325-33, 2010.

Xiong, Hui Yuan, Barash, Yoseph, Frey, Brendan J.: Predicción bayesiana del empalme regulado por tejidos utilizando la secuencia de ARN y el contexto celular. Bioinformática 27 (18): 2554-2562, 2011.

Barash, Y., Wang, X.: Una vista iluminada de la biología molecular. Biología del genoma 11 (8): 307, 2010.

Barash, Y., Calarco, J. A., Gao, W., Pan, Q., Wang, X., Shai, O., Blencowe, B. J., Frey, B. J.: Descifrando el código de empalme. Nature 465 (7294): 53-9, 2010.

Aznarez, I., Barash, Y., Shai, O., He, D., Zielenski, J., Tsui, L. C., Parkinson, J., Frey, B. J., Rommens, J. M., Blencowe, B. J.: Un análisis sistemático de las secuencias intrónicas aguas abajo de los sitios de empalme de 5 '' revela un papel generalizado de los motivos ricos en U y las proteínas TIA1 / TIAL1 en la regulación de empalme alternativo. Investigación del genoma 18 (8): 1247-58, 2008 Notas: primer autor co-correspondiente.

Fagnani, M., Barash, Y., Ip, JY, Misquitta, C., Pan, Q., Saltzman, AL, Shai, O., Lee, L., Rozenhek, A., Mohammad, N., Willaime- Morawek, S., Babak, T., Zhang, W., Hughes, TR, van der Kooy, D., Frey, BJ, Blencowe, BJ: Coordinación funcional del empalme alternativo en el sistema nervioso central de los mamíferos.. Biología del genoma 8 (6): R108, 2007 Notas: primer autor co-correspondiente.

Marion, R. M., Regev, A., Segal, E., Barash, Y., Koller, D., Friedman, N., O'Shea, E. K.: Sfp1 es un regulador sensible al estrés y a los nutrientes de la expresión génica de la proteína ribosómica. Actas de la Academia Nacional de Ciencias de los Estados Unidos de América 101 (40): 14315-22, 2004.

Barash, Y., Elidan, G., Kaplan, T., Friedman, N.: CIS: método de muestreo de importancia compuesta para la estimación del valor p del sitio de unión de proteína-ADN. Bioinformática 21 (5): 596-600, 2005.

Barash, Y., Friedman, N.: Agrupación bayesiana de contexto específico para datos de expresión génica. Revista de biología computacional 9 (2): 169-91, 2002.

Barash, Y., Elidan, G., Kaplan, T., Friedman, N.: Modelado de dependencias en sitios de unión proteína-ADN. Actas de la Séptima Conferencia Internacional Anual sobre Biología Molecular Computacional (RECOMB). ACM, página: 28-37, 2003.

Segal, E., Barash, Y., Simon, I., Friedman, N, Koller, D.: De la secuencia promotora a la expresión: un marco probabilístico. Actas de la VI Conferencia Internacional de Biología Molecular Computacional (RECOMB). ACM, página: 28-37, 2002.

Barash, Yoseph, Bejerano, Gill, Friedman, Nir: Un enfoque hipergeométrico simple para descubrir sitios de unión de factores de transcripción putativos. Algoritmos en Bioinformática. Springer Berlín / Heidelberg, 2149: 278-293, 2001.


Realizamos una amplia garantía de calidad en nuestro equipo y control de calidad de las muestras durante todo el proceso de secuenciación. Nuestro objetivo es siempre entregar datos útiles que puedan ayudarlo en su investigación.

Al mismo tiempo, la secuenciación de próxima generación por su propia naturaleza no siempre ofrece resultados igualmente sólidos. Una variedad de factores, incluida la variabilidad inherente al proceso de preparación de la biblioteca, la bioquímica que tiene lugar durante la secuenciación y la calidad de las muestras de ADN y ARN que recibimos, pueden afectar los resultados de un experimento determinado.

Haremos todo lo posible para lograr resultados que cumplan con los objetivos acordados, aunque no es posible garantizar que esos objetivos siempre se logren.

El Centro de Genoma recibe fondos del NCI a través del Recurso Compartido de Genómica del Centro Integral de Cáncer Herbert Irving designado por el NCI.

Somos un proveedor de servicios certificado por CSPro de Illumina, dedicado a garantizar la entrega de datos de la más alta calidad disponibles para aplicaciones de análisis genético.


INTRODUCCIÓN

Según la hipótesis del ARN mensajero (ARNm), revisada por primera vez por Jacob y Monod, cada ribosoma se ha considerado equivalente a todos los demás, un tabula rasa instruidos por los ARNm para formar las proteínas correspondientes (1). Para sostener el crecimiento de cualquier célula, aproximadamente la mitad de toda la síntesis de ARN es, por lo tanto, ARN ribosómico y las tasas variables de transcripción se mantienen en parte por la actividad relativa de múltiples copias de ADNr en el núcleo celular. En los seres humanos, alrededor de 400 repeticiones de ADNr se distribuyen entre cinco regiones organizadoras nucleolares (NOR) en los brazos cortos de los cromosomas acrocéntricos 13, 14, 15, 21 y 22 (2, 3, 4). La mayoría de las repeticiones están organizadas como matrices en tándem. El número de repeticiones de ADNr en NOR humanas individuales está en el rango de 1-3 a más de 140 (4, 5, 6), y solo 20-50% de todos los genes de ARN son transcripcionalmente activos en la mayoría de las células humanas (7). Una unidad de repetición de ADNr codifica una copia de las secuencias de ARNr 18S, 5.8S y 28S separadas por secuencias espaciadoras transcritas internas y flanqueadas por espaciadores transcritos externos (ETS) y un espaciador intergénico de ∼30 kb (IGS). El precursor 45S pre-rRNA transcrito es sintetizado por la polimerasa I y procesado en la especie madura de rRNA (8, 9).

La variación intragenómica en los genes del ARN ribosómico está bien documentada en varias especies (10, 11, 12, 13). Para humanos, los fragmentos de ADNr subclonados secuenciados de varios individuos encontraron evidencia temprana de variación, principalmente variantes de un solo nucleótido (SNV), en las regiones transcritas (14, 15, 16, 17) en comparación con una secuencia de referencia (18). Sin embargo, ninguna de las variantes observadas fue validada en ADN no clonado, y en los años intermedios, no ha habido un censo completo de las variantes del ADNr o su frecuencia dentro y entre individuos.

También se han observado grandes variantes estructurales dentro de las NOR humanas, incluidas las repeticiones de ADNr palindrómico (19). Pero nuevamente, no ha habido ningún estudio en la resolución de secuencia de la estructura o frecuencia de tales variantes, o el grado en que se comparten en individuos o poblaciones. De hecho, el único estudio sistemático informado de secuencias proximales (centroméricas) y distales (teloméricas) a las matrices de ADNr (20), basado en el análisis de cromosomas artificiales bacterianos (BAC) y clones de fosmidos disponibles en GenBank, concluyó que estas secuencias son casi idéntico entre los cinco pares de cromosomas acrocéntricos.

Desafortunadamente, el ensamblaje computacional de los NOR a partir de la secuenciación rápida del ADN humano total se ve obstaculizado por el tamaño y la similitud de las unidades de repetición en tándem de ADNr (21). El ensamblaje de repeticiones de ADNr a partir de datos de genoma completo da como resultado una representación de consenso que es adecuada para comparaciones entre especies, pero enmascara la variación dentro de especies e individuos (22). El problema de ensamblaje se simplifica mediante la clonación, que puede aislar algunas copias de ADNr para secuenciar, pero cada copia individual aún contiene repeticiones internas que son difíciles de ensamblar. Los avances recientes en la tecnología de secuenciación han dado como resultado longitudes de lectura de más de 100 kb (23), capturando unidades de ADNr completas en lecturas individuales y, por lo tanto, simplificando enormemente el ensamblaje de secuencias. Aunque la tasa de error de la secuenciación de lectura larga es relativamente alta, tecnologías como la secuenciación de una sola molécula PacBio producen un error mayoritariamente aleatorio que puede corregirse estadísticamente con suficiente profundidad de secuenciación, lo que da como resultado una precisión de consenso casi perfecta (& gt99,999%) (24 ). Por lo tanto, la secuenciación dirigida de lectura larga ha permitido por primera vez una reconstrucción muy precisa de unidades de ADNr individuales.

Utilizando una combinación de clonación de recombinación asociada a transformación (TAR) y tecnologías de secuenciación múltiple, presentamos una caracterización piloto de variantes en repeticiones de ADNr de un solo cromosoma de un individuo. Primero aislamos y secuenciamos unidades de ADNr individuales usando lecturas largas para identificar variantes candidatas. A continuación, estas variantes se validaron y se evaluaron sus frecuencias mediante la secuenciación de lectura larga y corta de genomas completos y transcriptomas muestreados de varios individuos. A partir de este análisis, se presenta una secuencia de referencia de ADNr mejorada junto con un nuevo catálogo de variantes de ADNr evaluadas con alta confianza.


  • Ensamblaje del genoma
  • Análisis del genoma posterior, como el hallazgo de genes
  • Alineación de secuencias y sus aplicaciones para la identificación de especies, la anotación del genoma y la comparación de genes
  • Construcción de árbol evolutivo
  • Análisis de metagenómica

Carnegie Mellon University es líder en ciencia automatizada, por lo tanto, los estudiantes también tendrán la oportunidad de trabajar en nuestro laboratorio de automatización. Utilizarán robots para ejecutar experimentos mientras aprenden cómo se puede utilizar el aprendizaje automático en el diseño y ejecución de experimentos.

Las presentaciones finales al cierre del programa permitirán a los estudiantes presentar su trabajo a los padres, tutores y otros invitados.

Boot Camp de programación

Se proporcionarán materiales preparatorios a los estudiantes admitidos antes del programa para proporcionar habilidades fundamentales de programación. & # 160 No se requiere experiencia previa en programación para tener éxito.


Información de soporte

Figura S1.

Especificación de phyla de cebadores conocidos para arqueas. Leyenda: Los cebadores conocidos se utilizaron para encontrar sus objetivos en un conjunto de datos de RDP que consta de 1544 Crenarchaeota, 4153 Euryarchaeota, 37 Korarchaeota, 3 Nanoarchaeota y 878 especies no clasificadas. Las secuencias sin diana se clasificaron en diferentes filos. Las secuencias y fuentes de los cebadores conocidos se refieren a la Tabla 3.

Figura S2.

Especificación de phyla de cebadores conocidos para eubacterias. Leyenda: Las secuencias y fuentes de los cebadores conocidos se muestran en la Tabla 3. Los detalles del conjunto de datos RDP en el que se utilizaron los cebadores para encontrar sus objetivos se encuentran en la Figura 3.


Ver el vídeo: Proyecto final Maquina de Turing (Mayo 2022).


Comentarios:

  1. Fresco

    Creo que comete un error. Puedo defender la posición. Escríbeme en PM, discutiremos.

  2. Boothe

    Pequeño zhzhot))))

  3. Keene

    ¿Con qué frecuencia publica noticias sobre este tema?

  4. Wichamm

    Y esto también pasa :)

  5. Gaspard

    Lo siento, no a este párrafo .....

  6. Ganymede

    no me molesta

  7. Shaktizshura

    En mi opinión usted comete un error. Puedo probarlo.



Escribe un mensaje