Mapeo de la diversidad en tripanosomas africanos utilizando proteómica espacial de alta resolución
HogarHogar > Noticias > Mapeo de la diversidad en tripanosomas africanos utilizando proteómica espacial de alta resolución

Mapeo de la diversidad en tripanosomas africanos utilizando proteómica espacial de alta resolución

Jul 01, 2023

Nature Communications volumen 14, número de artículo: 4401 (2023) Citar este artículo

2065 Accesos

26 altmétrica

Detalles de métricas

Los tripanosomas africanos son parásitos eucariotas dixenos que imponen una importante carga de enfermedades humanas y veterinarias en el África subsahariana. La diversidad entre especies y etapas del ciclo de vida es concomitante con distintos tropismos del huésped y del tejido dentro de este grupo. Aquí, se mapean los proteomas espaciales de dos especies de tripanosomas africanos, Trypanosoma brucei y Trypanosoma congolense, en dos etapas de la vida. Los cuatro conjuntos de datos resultantes proporcionan evidencia de la expresión de aproximadamente 5500 proteínas por tipo de célula. Más de 2500 proteínas por tipo de célula se clasifican en compartimentos subcelulares específicos, lo que proporciona cuatro proteomas espaciales completos. El análisis comparativo revela rutas clave de adaptación parasitaria a diferentes nichos biológicos y proporciona información sobre las bases moleculares de la diversidad dentro y entre estas especies de patógenos.

Los cinetoplastidos son eucariotas flagelados unicelulares que incluyen parásitos importantes de humanos, ganado y especies de plantas agrícolas y generalmente se transmiten por invertebrados. Dentro de esta clase se encuentran los tripanosomas africanos, que en conjunto infectan a una variedad de mamíferos y causan la tripanosomiasis africana en humanos y animales. La mayoría de las investigaciones que caracterizan los tripanosomas africanos se han realizado con Trypanosoma brucei; en parte porque dos subespecies son infectivas para los humanos y también por la relativa facilidad del cultivo in vitro y la manipulación genética de esta especie. T. brucei se ha estudiado como parásito, pero también como organismo modelo divergente, con características biológicas eucariotas de interés tanto bien conservadas como no canónicas. Las especies relacionadas, Trypanosoma congolense y Trypanosoma vivax, son los principales agentes causantes de la tripanosomiasis bovina. A pesar de su importancia veterinaria, se han realizado considerablemente menos investigaciones sobre estas especies1. Las diferentes especies de tripanosomas africanos tienen características celulares y de infección distintas, aunque se desconoce la base molecular de gran parte de esto2,3,4,5.

Los tripanosomas africanos están expuestos a una variedad de entornos externos diferentes durante su ciclo de vida y los parásitos diferencian entre una serie de etapas de vida, cada una de las cuales está adaptada para el crecimiento y la supervivencia en su entorno actual o preadaptada para el siguiente6. Cada etapa de la vida se basa en una arquitectura celular de núcleo polar común, altamente organizada, con un único flagelo y una colección de orgánulos de una y varias copias. Los tamaños relativos, las posiciones y el contenido de proteínas de los orgánulos varían según las etapas de la vida. Como en todas las células eucariotas, la localización subcelular de una proteína en los tripanosomas no sólo define el entorno bioquímico de esa proteína, sino también el potencial de interacciones moleculares. Por tanto, la función de las proteínas está íntimamente ligada a su localización.

Hay dos enfoques principales para determinar la localización de proteínas en una célula: microscopía y proteómica. La microscopía permite una resolución precisa de localizaciones específicas; puede detectar variaciones entre células dentro de una muestra; y puede identificar fácilmente proteínas localizadas en múltiples sitios, aunque puede sufrir artefactos de etiquetado o expresión inapropiada. Debido al requisito de obtener un anticuerpo específico de una proteína o de manipular genéticamente la proteína de interés, la microscopía generalmente se limita a una pequeña cantidad de proteínas por estudio. Los análisis microscópicos de todo el proteoma son conjuntos de datos valiosos y ricos, pero no son esfuerzos triviales y que requieren mucho tiempo y que hasta ahora se limitan a unas pocas especies: Saccharomyces cerevisiae7, humanos8 y T. brucei9.

La proteómica espacial, basada en el aislamiento o enriquecimiento de orgánulos seguido de espectrometría de masas (EM), permite la identificación de proteínas enriquecidas en ubicaciones subcelulares específicas, generalmente sin necesidad de modificación genética. Estos métodos han sido muy eficaces para revelar proteínas residentes de orgánulos o estructuras dentro de los tripanosomátidos, como las mitocondrias, los glicosomas, el flagelo y el núcleo10,11,12,13,14. Ahora se pueden utilizar métodos basados ​​en MS de alto rendimiento para localizar sistemáticamente miles de proteínas en un solo experimento para múltiples condiciones, estados o tipos de células15,16,17,18,19,20,21,22. Dichos métodos incluyen hyperLOPIT (localización hiperplexada de proteínas de orgánulos mediante etiquetado de isótopos)16,23. Se trata de un enfoque de proteómica cuantitativa mediante el cual se puede resolver un mapa espacial del proteoma sin la necesidad de aislar orgánulos individuales gracias a la aplicación de algoritmos de aprendizaje automático24,25,26,27. HyperLOPIT y metodologías LOPIT relacionadas se han utilizado para generar mapas espaciales de tipos de células de mamíferos, insectos, levaduras, plantas y protozoos16,21,28,29,30,31,32.

En este caso, se ha empleado hyperLOPIT, combinado con modelos computacionales, para mapear espacialmente los proteomas de T. brucei y T. congolense, cada uno en dos etapas de vida diferentes: la forma del torrente sanguíneo de los mamíferos (BSF) y la forma procíclica del intestino medio del insecto (PCF). 23,33. Esto ha dado como resultado cuatro conjuntos de datos completos y complementarios que (i) proporcionan individualmente evidencia de la expresión de proteínas y la asignación de la ubicación subcelular de miles de proteínas por tipo de célula, y (ii) en conjunto facilitan el análisis comparativo entre etapas de vida y especies. Esto ha puesto de relieve ubicaciones subcelulares clave en la adaptación parasitaria a nichos biológicos y la base molecular de la diversidad observada dentro y entre estas distintas especies de patógenos.

El flujo de trabajo experimental para hyperLOPIT en tripanosomas africanos (Fig. 1A) se desarrolló en base a trabajos anteriores23,28. Las células fueron lisadas por cavitación de nitrógeno10,34. Luego se separaron las membranas crudas y las proteínas solubles sobre un cojín de iodixanol y posteriormente se recogieron las membranas y se sedimentaron mediante ultracentrifugación. Las membranas se resolvieron mediante centrifugación en gradiente de densidad sobre un gradiente de iodixanol. Se recogieron aproximadamente 22 fracciones del gradiente y primero se evaluaron mediante transferencia Western para confirmar la resolución del compartimento (Figura 1 complementaria). Las fracciones se agruparon hasta 10 por experimento, lo que, además de la fracción soluble enriquecida en citosólico, formó la base para el marcaje TMT (etiqueta de masa en tándem) de 11 plex. Las fracciones marcadas con TMT se combinaron, se fraccionaron mediante UPLC de alto pH y se sometieron a MS cuantitativa multiplexada con LC-SPS-MS3.

Un resumen del flujo de trabajo experimental para implementar hyperLOPIT en tripanosomas africanos: las primeras células se recolectaron y lisaron mediante cavitación de nitrógeno liberando compartimentos subcelulares. Las proteínas solubles y las membranas crudas se separaron sobre un cojín de iodixanol seguido de la granulación de la fracción membranosa, que luego se resolvió mediante centrifugación en gradiente de densidad. Después de la recolección, las fracciones se analizaron mediante transferencia Western, se combinaron estratégicamente y se prepararon para proteómica cuantitativa multiplexada con análisis LC-SPS-MS3. La identificación y cuantificación de péptidos se realizaron en ProteomeDiscoverer y el procesamiento adicional, incluida la agregación y la normalización, se realizó en R. Los conjuntos de datos se inspeccionaron visualmente (t-SNE) y con agrupación no supervisada (HDBSCAN). La agrupación no supervisada guió la curación de proteínas marcadoras aliadas con Novedad-TAGM para un mayor descubrimiento en T. congolense. Las proteínas marcadoras resultantes se utilizaron en la clasificación de proteínas no caracterizadas utilizando TAGM-MAP. Se realizaron análisis adicionales con TAGM-MCMC para conocer las proteínas no clasificadas con TAGM-MAP que pueden residir en múltiples ubicaciones. Imagen creada con BioRender.com. B Se realizaron tres iteraciones experimentales de hyperLOPIT (n.° 1 a 3) y los datos de todas las iteraciones se concatenaron por tipo de celda. Los diagramas de Venn muestran que los conjuntos de datos finales contienen aproximadamente 5500 proteínas por tipo de célula para las cuales hay datos cuantitativos de 33 complejos. C La reducción de dimensionalidad a través de la proyección t-SNE facilita la visualización de cada conjunto de datos de 33 dimensiones en dos dimensiones, lo que revela la estructura dentro de los datos. Cada punto representa una proteína.

En proteómica espacial, a menudo ningún experimento individual logra una resolución óptima del compartimento subcelular; sin embargo, múltiples experimentos en combinación pueden mejorar colectivamente la resolución del compartimento y la localización de proteínas35. Por tanto, para cada uno de los cuatro tipos de células, se llevaron a cabo tres iteraciones experimentales. En cada caso, los métodos de lisis celular y combinación de fracciones variaron entre cada uno de los tres experimentos independientes (Datos complementarios 1), con miras a mejorar la resolución general una vez que se combinaron los datos. Se identificaron proteínas 6561-6692 en las tres iteraciones experimentales y se concatenaron cuantificaciones de cada uno de los experimentos de 11 complejos (creando un conjunto de datos de 33 complejos; consulte la Nota complementaria). Se utilizó el análisis de componentes principales para demostrar que, a pesar de la variación deliberada en el método experimental entre los experimentos, las fracciones de 11 complejos tienden a agruparse en todos los experimentos, lo que indica una buena reproducibilidad del método de fraccionamiento (Figura complementaria 2) 36,37. Se eliminaron las proteínas que faltaban en cualquier iteración por tipo de célula. Esto resultó en 5439–5731 proteínas para la caracterización espacial del proteoma (Fig. 1B y Datos complementarios 2). Después de la normalización, cada conjunto de datos de 33 dimensiones se proyectó en dos dimensiones mediante t-SNE (incrustación de vecinos estocásticos distribuidos en t) para su visualización (Fig. 1C)38. Esto reveló una estructura dentro de cada conjunto de datos con resolución de colecciones discretas de proteínas de acuerdo con la similitud en los perfiles de abundancia en el gradiente de densidad que, a su vez, se esperaría que tuvieran localizaciones subcelulares similares39.

A continuación, se examinó la estructura de datos para determinar si correspondía a la resolución de nichos subcelulares. Primero, los perfiles de distribución de abundancia de grupos de proteínas o complejos de proteínas seleccionados funcionalmente relacionados se visualizaron en T. brucei BSF y PCF (Figura complementaria 3 y Datos complementarios 3). Las cohortes funcionales de proteínas mostraron evidencia clara de distribuciones distintas y comunes a lo largo del gradiente. Estas distribuciones indican una resolución diferencial de proteínas funcionalmente relacionadas dentro de los conjuntos de datos de T. brucei consistentes con su organización espacial.

Para evaluar la resolución espacial de manera más global y basada en datos, los conjuntos de datos se sometieron a agrupación no supervisada utilizando HDBSCAN (agrupación espacial de aplicaciones con ruido basada en densidad jerárquica)28,40. En este algoritmo, se evaluó la similitud de los perfiles de abundancia de proteínas en los 33 canales TMT (correspondientes a tres experimentos). Cada grupo resultante representa un conjunto de proteínas colectivamente bien resueltas a lo largo del gradiente de densidad, que a su vez probablemente representan nichos subcelulares discretos. El análisis HDBSCAN reveló entre 20 y 30 grupos compuestos en conjunto por 1144-1302 proteínas por tipo de célula con 9-417 proteínas por grupo, como se resalta en las proyecciones t-SNE (Fig. 2). El análisis de enriquecimiento GO CC (Componente celular de ontología genética) confirmó que los grupos representan un conjunto diverso de nichos biológicos relevantes dentro de la célula (Fig. 2). En algunos casos, también se observó resolución de subcompartimentos; por ejemplo, hubo resolución de proteínas mitocondriales membranosas y solubles en cada tipo de célula (Fig. 2). El contenido de cada grupo HDBSCAN también se analizó para determinar las características de las proteínas, incluidos los dominios pI (punto isoeléctrico), TM (transmembrana), péptidos señal y anclajes GPI (glicosilfosfatidilinositol) (Figura 4 complementaria y Datos complementarios 4)41,42,43. 44. Las propiedades biofísicas de los grupos exhibieron una resolución diferencial clara y racional. Por ejemplo, los grupos enriquecidos con proteínas mitocondriales mostraron un pI con desplazamiento alcalino, mientras que los grupos enriquecidos con proteínas del citosol mostraron un pI con desplazamiento ácido (Figura complementaria 4A)45. Las proteínas con dominios TM predichos estaban en grupos asociados con términos GO CC relacionados, como las membranas mitocondriales, el ER (retículo endoplásmico) y la membrana pelicular (Fig. 2). Las proteínas que se predijo que contenían péptidos señal o anclajes GPI estaban principalmente en grupos asociados con términos GO CC como "sistema de endomembrana" (Figura complementaria 4B). En conjunto, estos análisis demuestran la resolución de diversos compartimentos subcelulares con características proteicas bioquímicas compuestas relevantes de acuerdo con las expectativas dentro de cada conjunto de datos.

Los grupos HDBSCAN se resaltaron en las proyecciones t-SNE para (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF y (iv) T. congolense PCF. Los términos GO CC significativamente representados en cada grupo se muestran en la leyenda asociada con cada proyección t-SNE (NS = no significativo, sin términos significativamente representados). La representación proporcional de dominios TM únicos o múltiples predichos entre las proteínas en cada grupo se muestra debajo de cada nombre de grupo en la leyenda asociada.

A continuación, los proteomas espaciales se caracterizaron utilizando enfoques de aprendizaje automático semisupervisados. Se han desarrollado varios métodos para usar con datos LOPIT para clasificar proteínas no marcadas en un conjunto de compartimentos para definir el proteoma espacial25,26,27. En este caso, esto se realizó utilizando el modelo TAGM (mezcla gaussiana aumentada en t) con el método TAGM-MAP (máximo a posteriori). Esto calcula la probabilidad de que una proteína pertenezca a uno de los compartimentos subcelulares predefinidos y a un componente atípico, que puede usarse como base para la clasificación de proteínas. Para realizar este análisis, primero se requirieron proteínas marcadoras que representaran colectivamente los compartimentos de la célula.

Los marcadores de T. brucei se seleccionaron basándose en una revisión de la literatura y la anotación GO CC, y se guiaron por la agrupación HDBSCAN, con exclusión de proteínas atípicas o aquellas localizadas diferencialmente entre BSF y PCF (Figura complementaria 5A y Datos complementarios 5). T. congolense está menos estudiado, por lo que este enfoque no fue factible. En cambio, se desarrolló un conjunto de marcadores inicial basado en ortólogos de marcadores de T. brucei o asignaciones TAGM-MAP y guiado por la agrupación HDBSCAN. Como las diferencias entre T. brucei y T. congolense podrían dar lugar a nichos biológicos no representados pero resueltos, también se realizó el método bayesiano semisupervisado, Novedad TAGM, utilizando este conjunto de marcadores inicial (Datos complementarios 5-6)46. Este algoritmo permite el descubrimiento de compartimentos no etiquetados además de asignar proteínas a compartimentos definidos. Las asignaciones resultantes se utilizaron para definir compartimentos resueltos por separado en T. congolense y guiar la expansión de los marcadores en los compartimentos existentes (Figura complementaria 6A). Se seleccionaron un total de 891 proteínas marcadoras de T. brucei, con 852 y 849 proteínas que representan 20 nichos subcelulares distintos en BSF y PCF, respectivamente (Figura complementaria 5B, C, Tabla 1 y Datos complementarios 5 y 7). Para T. congolense, se seleccionaron un total de 734 proteínas marcadoras, con 719 y 713 proteínas que representan 23 y 19 nichos subcelulares distintos en BSF y PCF, respectivamente (Figuras complementarias 6B, C, Tabla 1 y Datos complementarios 5 y 7).

A continuación, se realizó la clasificación de proteínas no marcadas utilizando TAGM-MAP para asignar proteínas a compartimentos subcelulares (Fig. 1A y Datos complementarios 8 y 9). A cada proteína se le asignó probabilísticamente una asignación de compartimento. Las asignaciones representan la localización compartimental más probable de cada proteína dentro del conjunto de datos. Las clasificaciones de proteínas se generan aplicando un umbral a estas asignaciones, y las proteínas que no cumplen los criterios se designan como "desconocidas". Para evaluar la reproducibilidad de las clasificaciones de resultados entre iteraciones experimentales individuales dentro de tipos de células, se realizaron clasificaciones en cada conjunto de datos individual de 11 complejos (antes de la concatenación en sus respectivos conjuntos de datos de 33 complejos). Los conjuntos de datos individuales se compararon por pares utilizando el índice de Rand ajustado e indicaron una buena consistencia (> 0,85 para todas las comparaciones por pares), lo que demuestra la reproducibilidad entre las iteraciones experimentales (Figura 7 complementaria y Datos complementarios 8)47. A continuación, para definir los proteomas espaciales para cada tipo de célula, se generaron clasificaciones finales realizando un análisis TAGM-MAP en cada conjunto de datos combinado de 33 plex (Fig. 1A y Datos complementarios 9). Utilizando este enfoque, se clasificaron 2679 y 2795 proteínas en T. brucei BSF y PCF respectivamente (Fig. 3A, B y Datos complementarios 9). En T. congolense, se clasificaron 2507 y 2504 proteínas en BSF y PCF respectivamente (Fig. 3A, B y Datos complementarios 9). Estos cuatro proteomas espaciales proporcionan un conjunto completo de datos de localización para dos especies estrechamente relacionadas, en dos etapas de vida cada una, algo que no se había logrado antes a esta escala en ningún organismo parásito.

A Proteínas marcadoras y clasificaciones TAGM-MAP resaltadas en proyecciones t-SNE para (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF y (iv) T. congolense PCF (los colores de los compartimentos son como se indica en el panel B). Proteínas marcadoras B (área transparente) y clasificaciones TAGM-MAP de proteínas no marcadas (área opaca) visualizadas en diagramas de barras proporcionalmente, agrupadas según el compartimento para el tipo de célula indicado. El número total de proteínas se indica a la derecha. C Gráficos de violín que muestran la distribución de las probabilidades de localización en cada compartimento subcelular según el análisis TAGM-MCMC en T. brucei PCF para (i) MICU1 y (ii) SDH1.

Para cuestionar la fidelidad y validar las clasificaciones TAGM-MAP, los cuatro conjuntos de datos se inspeccionaron utilizando anotaciones de localización alternativas. Para cada ubicación subcelular, las proteínas clasificadas se sometieron a un análisis de enriquecimiento del término GO CC (Fig. 4A y Fig. 8 complementaria). La anotación de términos de GO CC incluye localizaciones seleccionadas basadas en estudios experimentales43. Esto reveló patrones claros y sensibles para todos los compartimentos en todos los tipos de células. Por ejemplo, el flagelo 1 se enriqueció con términos que incluían "axonema" y "bastones paraflagelares", mientras que los secretores/endocíticos 1-3 se enriquecieron con términos que incluían "membrana pelicular", "aparato de Golgi" y "bolsa ciliar". La localización subcelular de proteínas también se comparó con predicciones de localización basadas en secuencias utilizando DeepLoc (Fig. 4B y Datos complementarios 4)48. Las predicciones para las proteínas clasificadas en cada compartimento subcelular en los cuatro conjuntos de datos mostraron una clara concordancia en las localizaciones de las proteínas. Como ejemplos: entre el 66% y el 73% de las clasificaciones de citosol mostraron una predicción DeepLoc del citoplasma, y ​​entre el 74% y el 81% de las clasificaciones mitocondriales colectivas (mitocondria – OM (membrana externa), IM (membrana interna) y matriz 1, 2 y 3). mostró una predicción DeepLoc de la mitocondria. Juntos, los términos GO CC y las predicciones de DeepLoc en cada conjunto de clasificaciones de compartimentos hyperLOPIT indican un alto nivel de concordancia de las clasificaciones TAGM-MAP con enfoques de localización alternativos.

Un mapa de calor de la representación de términos GO CC en las clasificaciones TAGM-MAP para T. brucei BSF. Los compartimentos hyperLOPIT están en el eje Y, los términos GO CC están en el eje X, los colores se escalan según el −log10 (valor p) para la sobrerrepresentación de los términos GO CC en el compartimento indicado en comparación con el proteoma de fondo. B Predicciones de compartimentos subcelulares de DeepLoc visualizadas con diagramas de barras proporcionalmente, agrupados según el compartimento para (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF y (iv) T. congolense PCF. El número total de proteínas clasificadas para cada compartimento se indica a la derecha.

El análisis TAGM-MAP proporcionó información completa sobre la organización espacial de la célula tripanosoma con la clasificación de miles de proteínas en compartimentos subcelulares. En algunos casos, las proteínas no se clasificaron con suficiente confianza en un solo compartimento debido a la incertidumbre atribuida a la localización dinámica de las proteínas (localización en más de un compartimento subcelular). Para proporcionar información sobre tales casos, se empleó TAGM-MCMC (cadena de Markov Monte-Carlo) (Datos complementarios 10). 84-86% de las clasificaciones TAGM-MAP coinciden con las de las asignaciones TAGM-MCMC. La utilidad clave de TAGM-MCMC para estos conjuntos de datos es conocer la localización de proteínas que se desconocían en TAGM-MAP debido a una posible localización dinámica. Varios casos resaltan proteínas que pueden exhibir localización en más de un compartimento. Por ejemplo, en T. brucei PCF, donde las membranas mitocondriales estaban particularmente bien resueltas, MICU1 (captación de calcio mitocondrial 1) muestra niveles de incertidumbre asociados con la IM y la OM mitocondriales. Esta proteína funciona en la importación de calcio en la mitocondria y potencialmente forma un sitio de contacto entre el IM y el OM (Fig. 3C)10,49,50. De manera similar, la succinato deshidrogenasa, SDH1 muestra incertidumbre con la matriz mitocondrial 2 y la IM, esto está respaldado por su localización en la matriz mitocondrial y una asociación funcional adicional con la SDH en la membrana mitocondrial interna (Fig. 3C)51.

Los cuatro proteomas espaciales se desarrollaron y caracterizaron mediante la implementación de aprendizaje automático no supervisado y semisupervisado mediante los algoritmos HDBSCAN, Novedad TAGM, TAGM-MAP y TAGM-MCMC. Las clasificaciones TAGM-MAP son las clasificaciones principales y forman la base de los proteomas espaciales informados en este trabajo. Los cuatro conjuntos de datos proporcionan evidencia de la expresión de ~ 5500 proteínas con 2504–2795 clasificaciones en 19–23 compartimentos por tipo de célula. El interrogatorio de los proteomas espaciales, como se visualiza en las Figs. 2 a 4 y figuras complementarias. 2-6, demuestran que los compartimentos conocidos de la célula se resolvieron definitivamente mediante la metodología empleada aquí. En este análisis estuvieron representados todos los nichos subcelulares principales de la célula, incluidas las proteínas citosólicas solubles, los grandes complejos moleculares y los de los compartimentos membranosos o estructuras citoesqueléticas. Cada uno de estos conjuntos de datos proporciona un mapa espacial que se puede utilizar por separado o en varias combinaciones para informar sobre localizaciones de proteínas individuales o componentes proteicos de estructuras u orgánulos celulares. Además de los conjuntos de datos incluidos aquí, los datos también están disponibles en un formato interactivo a través de una aplicación R Shiny.

El citosol era uno de los compartimentos más grandes. Algunos complejos de proteínas citosólicas se resolvieron por separado, incluido el proteosoma y la partícula reguladora del proteosoma, además de las ribonucleoproteínas 1 y 2, que estaban compuestas predominantemente de proteínas ribosómicas o factores de iniciación de la traducción. También estuvieron representados los pequeños orgánulos membranosos que se encuentran en el citoplasma, incluidos los acidocalcisomas y los glicosomas.

El núcleo se resolvió en dos compartimentos: el primero contenía componentes de cromatina, mientras que el segundo contenía componentes nucleolares y no cromatínicos. Este último estaba enriquecido con proteínas nucleolares, aunque también incluía proteínas implicadas en otros procesos localizados en el núcleo, como el empalme. Hay ejemplos de proteínas que se espera que estén clasificadas nuclearmente en el citosol. En algunos casos esto se relaciona con el tráfico, por ejemplo, varias importinas fueron clasificadas en el citosol. También hay casos en los que esto puede deberse a la ruptura o fuga del núcleo durante el método de lisis o separación. El núcleo es particularmente sensible a la ruptura y el método de lisis elegido aquí, cuyo objetivo es generar un lisado enriquecido con todos los compartimentos subcelulares, no es el que se utilizaría para un estudio específico del núcleo.

La mitocondria se resolvió particularmente bien en este análisis, incluidas las proteínas mitocondriales de la matriz y la membrana en todos los tipos de células. Además, en los PCF, se resolvieron la IM y la OM mitocondriales. A pesar de la falta de grupos no supervisados ​​representativos de la OM en BSF, la inspección visual indicó la resolución de proteínas relacionadas y la OM fue designada como un compartimento para clasificaciones en todos los tipos de células. Se observó resolución funcional de la matriz mitocondrial en hasta tres nichos distintos. El subgrupo no fue consistente entre todos los tipos de células, con algunas diferencias entre las matrices 1-3 en marcadores y clasificaciones. La matriz mitocondrial 1 contiene proteínas ribosomales mitocondriales grandes y/o pequeñas, con proteínas ribosómicas grandes en la matriz mitocondrial 2 en T. congolense PCF y la matriz 3 en BSF. La matriz mitocondrial 2 comprende proteínas involucradas en diversos procesos bioquímicos localizados mitocondriales, incluida la edición de ARN; ensamblaje de racimos de hierro y azufre; y plegamiento de proteínas52. La matriz mitocondrial 3 se separó únicamente en T. congolense BSF y se enriqueció con un subconjunto de proteínas ribosómicas grandes. Este nivel de resolución de suborgánulos no tiene precedentes en los estudios LOPIT. Además, cuando se consideran colectivamente como un solo compartimento (proteínas de matriz y membrana), había entre 751 y 1091 proteínas en el conjunto mitocondrial, lo que lo convierte en el compartimento más grande en este análisis (Tabla 1 y Datos complementarios 7).

Los compartimentos citoesqueléticos estaban representados por el flagelo 1 y 2, y las estructuras de microtúbulos 1 y 2. El flagelo 1 comprende los componentes citoesqueléticos centrales del flagelo, incluidos el axonema y el bastón paraflagelar. Solo en T. congolense BSF, un subconjunto de proteínas flagelares se resolvió en un segundo compartimento denominado flagelo 2 que contenía predominantemente proteínas de varillas paraflagelares. Esta resolución puede deberse a la adherencia mediada por flagelo de T. congolense BSF a los matraces de cultivo, lo que afecta la integridad del compartimento durante la recolección53,54. Las estructuras de microtúbulos 1 comprenden proteínas citoesqueléticas asociadas con estructuras proximales flagelares y de microtúbulos, incluidas proteínas que se localizan en el bilobulillo, el cuarteto de microtúbulos o el cuerpo basal. Las estructuras de microtúbulos 2 comprenden proteínas que interactúan con el citoesqueleto, incluidas aquellas involucradas en la organización del citoesqueleto, el movimiento basado en microtúbulos y la división celular. Entre los diferentes tipos de células, este conjunto incluye proteínas asociadas con los microtúbulos subpeliculares, el filamento FAZ (zona de unión del flagelo) y la punta de FAZ55. Se ha informado que muchas proteínas de este conjunto se localizan en el surco de escisión, funcionan en la citocinesis o interactúan con reguladores de la citocinesis56,57,58.

También estuvieron representados los componentes de la vía secretora, incluido el RE. El RE contiene una alta proporción (51–72%) de proteínas que se predice que contienen dominios TM, lo que coincide con la presencia de proteínas de la membrana del RE y proteínas destinadas a la superficie u otros compartimentos. La vía secretora colectiva post-ER, la superficie, la vía endocítica y la vía endosómica se resolvieron en hasta tres compartimentos denominados secretor/endocítico 1–3. Secretor/endocítico 1 incluye proteínas de Golgi, bolsa flagelar, tráfico y lisosomales. El secretor/endocítico 2 incluye supuestos transportadores de superficie que incluyen miembros de familias de genes bien conservadas: transportadores de aminoácidos (hOG00078), nucleósidos (hOG00116) y hexosas (hOG00081)59. El secretor/endocítico 3 incluye supuestas proteínas de superficie y endosómicas, así como muchas proteínas que son específicas de una etapa o carecen de ortólogos en las otras especies. El análisis TAGM novedoso y la revisión de proteínas relacionadas en T. congolense PCF no indicaron que hubiera una contraparte secretora/endocítica 3 resuelta aquí, por lo que se omitió para este tipo de célula.

Si bien los resultados proteómicos espaciales para los cuatro tipos de células se pueden utilizar de forma independiente, los conjuntos de datos también se pueden comparar para informar sobre características nuevas o divergentes entre etapas de vida o especies (Tabla 1 y Datos complementarios 7).

Para comparar las etapas de la vida, se visualizaron en un mapa de calor proteínas comunes entre los compartimentos de BSF y PCF dentro de una especie (Fig. 5A). Las proteínas 4844 y 5051 eran comunes a BSF y PCF en T. brucei y T. congolense, respectivamente. Como era de esperar, hubo buena concordancia dentro de cada especie en la mayoría de los compartimentos. Las estructuras del núcleo y los microtúbulos mostraron el nivel más bajo de concordancia. En conjunto, las estructuras de microtúbulos 2 tienen la menor concordancia entre las etapas de la vida, y muchas de las localizaciones diferenciales se deben a clasificaciones en otros compartimentos del citoesqueleto (flagelo y estructuras de microtúbulos 1) en la otra etapa de la vida. Dado que en este conjunto se encuentran proteínas involucradas en la división celular con localización dinámica y que estas células eran asincrónicas, tales diferencias surgirán debido a divergencias espaciotemporales en el ciclo celular entre las BSF y las PCF60,61. Las proteínas con localización diferencial en el núcleo incluyeron 81 proteínas de T. brucei clasificadas en el núcleo en PCF pero ribonucleoproteínas en BSF. Esto incluyó marcadores de gránulos de estrés como DHH1, MKT1, PABP2, PBP1 y SCD662. T. brucei BSF estuvo sujeto a una recolección más prolongada que PCF, así como a diferentes condiciones de lavado, lo que puede haber conducido a la formación de gránulos de estrés. La clasificación de estas proteínas en el núcleo en T. brucei PCF probablemente esté asociada con gránulos de la periferia nuclear que, según se informa, contienen muchas de las mismas proteínas que los gránulos de estrés y están localizados en la periferia nuclear63. También hubo casos de clasificación al núcleo en T. brucei BSF y al citosol en PCF. Como se describió anteriormente, la fuga del núcleo durante el método experimental explica algunos de estos, además de las proteínas que circulan entre el núcleo y el citosol.

Un mapa de calor de la concordancia entre compartimentos de proteínas comunes en (i) T. brucei BSF y PCF, y (ii) T. congolense BSF y PCF. El color del mosaico se escala según la concordancia entre las etapas de la vida. B Perfil de distribución de abundancia para RISP en (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF y (iv) T. congolense PCF en relación con la asignación a mitocondria – matriz en BSF o IM en PCF. C Representación proporcional de compartimentos en proteínas específicas de etapa visualizadas en diagramas de barras para el tipo de célula indicado. Gráfico D Lollipop que muestra el enriquecimiento de los compartimentos sobrerrepresentados en proteínas específicas de la etapa para el tipo de célula indicado. El tamaño del círculo se escala según el recuento de proteínas en el compartimento indicado y el color según el valor p para la sobrerrepresentación del compartimento frente al proteoma de fondo. El análisis de enriquecimiento se realizó utilizando la función 'enriquecedor' clusterProfiler (v4.0.5) con la configuración predeterminada (prueba hipergeométrica p <0,05 con ajuste de Benjamini y Hochberg).

También se observó una localización diferencial de proteínas específica de la etapa entre otros compartimentos, algunas de las cuales pueden deberse a diferencias mecánicas que resultan en una disociación diferencial durante la lisis. Por ejemplo, el TAC (complejo de unión tripartita) no se resolvió como un compartimento único y algunas proteínas TAC clasificadas en estructuras de microtúbulos 1 en T. brucei BSF estaban en compartimentos mitocondriales en PCF. Dada la posición del TAC en el cuerpo basal y la membrana mitocondrial, tales localizaciones diferenciales pueden ser el resultado de una separación diferencial durante la lisis o de una diversidad en la disposición de estas estructuras entre tipos de células. Otras divergencias parecen ser auténticas, por ejemplo, RISP (proteína de hierro y azufre de Rieske), se clasificó en la IM mitocondrial en PCF T. brucei y T. congolense, pero en la matriz en T. brucei BSF (Fig. 5B). También se asigna a la matriz en T. congolense BSF, aunque por debajo del umbral de confianza para la clasificación. RISP es una subunidad esencial para la actividad del complejo III en la cadena de transporte de electrones en el IM. El ensamblaje del complejo III ocurre secuencialmente después de la importación y, por lo tanto, la ausencia de una subunidad puede afectar el ensamblaje. Se informa que T. brucei BSF tiene una cadena de transporte de electrones reducida con componentes del complejo III y IV funcionalmente ausentes64. Aquí, la subunidad del complejo III ubiquinol-citocromo C reductasa (Tb927.10.4280/TcIL3000.A.H_000752100) se clasificó en IM en ambas etapas de PCF, pero estuvo ausente en ambas BSF. En levadura, esta proteína precede a RISP en el ensamblaje del complejo III65. Por tanto, la ausencia de esta proteína es consistente con la presencia de RISP en la matriz y no en el IM integrado con el complejo III.

Había entre 593 y 743 proteínas específicas de etapa dentro de cada especie: proteínas presentes exclusivamente en una sola etapa de vida por especie. La representación de los compartimentos LOPIT entre proteínas específicas de la etapa se visualizó en gráficos de barras (Fig. 5C). El análisis de enriquecimiento indicó que el compartimento secretor/endocítico estaba enriquecido en proteínas exclusivas de T. brucei BSF, T. congolense BSF y T. congolense PCF (Fig. 5D). Mientras que las membranas mitocondriales se enriquecieron exclusivamente con proteínas exclusivas de las etapas de PCF (Fig. 5D). Las proteínas secretoras/endocíticas específicas de la etapa en las BSF incluyen proteínas anotadas como VSG (glucoproteínas de superficie variantes) e ISG (glucoproteínas de superficie invariantes), además de proteínas implicadas en la interacción con el huésped, como FHR (receptor del factor H) y HpHbR (haptoglobina). -receptor de hemoglobina) en T. brucei BSF66,67. En las PCF, las proteínas secretoras/endocíticas específicas de la etapa incluyen trans-sialidasas, adenilato y guanilato ciclasas y transportadores de aminoácidos. Las proteínas de la membrana mitocondrial específicas de la etapa en las PCF incluyen componentes de la cadena de transporte de electrones, como las subunidades de la citocromo oxidasa. Estos datos demuestran hasta qué punto los compartimentos secretores/endocíticos actúan como un punto de adaptación del desarrollo en ambas etapas de la vida y la mitocondria exclusivamente en las PCF.

Para examinar las diferencias entre especies, los compartimentos de ortólogos 1 a 1, determinados con OrthoFinder, entre etapas de vida equivalentes en cada especie se visualizaron en un mapa de calor (Datos complementarios 11 y Fig. 6A). Según los ortólogos 1 a 1, había 3635 proteínas comunes a las BSF y 3887 proteínas a las PCF de T. brucei y T. congolense. Al igual que el análisis intraespecies, hubo buena concordancia entre especies en la mayoría de los compartimentos. Los compartimentos con el nivel más bajo de concordancia fueron nuevamente el núcleo y los microtúbulos 2. Se observó un perfil de divergencia entre compartimentos similar al del análisis comparativo de etapas de vida, descrito anteriormente. Sin embargo, también surgieron nuevas divergencias, por ejemplo, la CDA (citidina desaminasa) se clasificó en el citosol en T. congolense BSF y PCF, pero en la matriz mitocondrial en T. brucei BSF (Fig. 6B). También se asignó a la matriz mitocondrial en T. brucei PCF, aunque por debajo del umbral de confianza de TAGM-MAP y el análisis TAGM-MCMC sugiere que esto se debe a la incertidumbre entre la matriz mitocondrial 1 y 2 (Fig. 6C y Datos complementarios 10). El CDA se ha localizado en la mitocondria en T. brucei PCF y funciona en la recuperación de pirimidina con pasos posteriores que ocurren en el citosol68. La localización en el citosol en T. congolense también es consistente con otros eucariotas; por ejemplo, el CDA humano (P32320) está anotado como citosólico69.

Un mapa de calor de la concordancia entre compartimentos en ortólogos 1 a 1 de proteínas comunes en (i) T. brucei BSF y T. congolense BSF, y (ii) T. brucei PCF y T. congolense PCF. El color del mosaico se escala según la concordancia entre las etapas de la vida. B Perfil de distribución de abundancia para CDA en (i) T. brucei BSF, (ii) T. brucei PCF, (iii) T. congolense BSF y (iv) T. congolense PCF en relación con la asignación a la mitocondria en T. brucei o al citosol en T. congolense. C Gráfico de violín que muestra la distribución de las probabilidades de localización en cada compartimento subcelular según el análisis TAGM-MCMC en T. brucei PCF para CDA. D Representación proporcional de compartimentos en diversas proteínas de conjuntos de genes visualizadas en diagramas de barras para el tipo de célula indicado. Gráfico E Lollipop que muestra el enriquecimiento de los compartimentos sobrerrepresentados en diversas proteínas de conjuntos de genes para el tipo de célula indicado. El tamaño del círculo se escala según el recuento de proteínas en el compartimento indicado y el color según el valor p para la sobrerrepresentación del compartimento frente al proteoma de fondo. El análisis de enriquecimiento se realizó utilizando la función 'enriquecedor' clusterProfiler (v4.0.5) con la configuración predeterminada (prueba hipergeométrica p <0,05 con ajuste de Benjamini y Hochberg).

A continuación, se evaluaron las proteínas que no mostraban una ortología 1 a 1 entre T. brucei y T. congolense; estos son casos en los que los ortogrupos contienen más de un gen o un ortogrupo es específico de una especie (dentro de T. brucei, T. congolense, T. vivax y T. cruzi). Estos casos son de particular interés cuando se considera la especiación e incluyen familias de genes ampliadas, así como ganancias de genoma específicas de especies. Para considerar estos genes con respecto a los proteomas espaciales, según el análisis de OrthoFinder se definió como "conjunto de proteínas diversificadas" un conjunto de proteínas codificadas por genes expandidos o específicos de especie. En cada tipo de célula estaban presentes entre 429 y 716 miembros de este conjunto. El análisis de enriquecimiento indicó que el compartimento secretor/endocítico estaba enriquecido en proteínas diversificadas para todos los tipos de células (Fig. 6D, E). Este conjunto incluye un ortogrupo (hOG00009) con un solo gen anotado como VSG atípico en T. brucei expandido a 212 genes en T. congolense. Si bien esta proteína está ausente en los proteomas de T. brucei, 14 miembros de este ortogrupo estaban presentes en los proteomas de T. congolense: 12 en BSF y cuatro en PCF. De las proteínas BSF, ocho se clasificaron en secretoras/endocíticas 3; Se prevé que cuatro contengan un ancla GPI y cuatro no, lo que recuerda al formato GPI del TfR (receptor de transferrina) heterodimérico en el que solo una subunidad posee un ancla GPI70.

Interpretar mejor los procesos moleculares de diversificación evolutiva de estos parásitos, el origen ancestral de los ortogrupos y los casos de expansión o contracción genética entre T. brucei-T. congolenses fueron examinados. El compartimento secretor/endocítico se enriqueció constantemente con ortogrupos que mostraban novedad y expansión en todos los tipos de células, incluidos, por ejemplo, pocos ortogrupos entre T. brucei-T. ortogrupos congolense y específicos de especies (Figuras complementarias 9A-C). 27 proteínas en ortogrupos específicos de T. brucei o específicos de T. brucei y T. congolense que no estaban anotados como VSG o ISG estaban presentes de forma única en T. brucei BSF en secretor/endocítico 1-3. Se predice que al menos seis tendrán una estructura similar a un haz de tres hélices que se ha observado en proteínas de superficie de tripanosoma como HpHbR y FHR (Figura complementaria 9D)67,71,72,73. Esto demuestra la utilidad de este conjunto de datos, particularmente cuando se combina con otros recursos de todo el proteoma, para acelerar los estudios centrados en compartimentos subcelulares de interés, como la superficie. Además, en conjunto, este análisis destaca los compartimentos secretores/endocíticos como nichos subcelulares activos de diversificación evolutiva en estas especies.

En este estudio, se han mapeado los proteomas de dos especies de tripanosomas africanos relacionadas pero distintas para dos etapas de la vida. En conjunto, se detectaron entre 5439 y 5731 proteínas y entre 2504 y 2795 se clasificaron en uno de los 19 a 23 compartimentos subcelulares. Se implementaron una serie de métodos de aprendizaje automático para generar conjuntos de datos granulares que reflejan la resolución intrínseca dentro de cada tipo de célula. La fidelidad de las clasificaciones se corroboró mediante enfoques ortogonales y computacionales.

Estos conjuntos de datos completos comprenden el mayor número de proteínas detectadas en un estudio proteómico en T. congolense hasta la fecha y uno de los más altos para T. brucei. Son recursos ejemplares para la comunidad de investigación de parásitos y pueden aprovecharse fácilmente mediante la integración con conjuntos de datos ómicos existentes y futuros. Además de la información de localización de miles de proteínas por tipo de célula, dicha cobertura del proteoma tiene utilidad como evidencia de la expresión de proteínas en cada tipo de célula. Esto es de particular valor para T. congolense, que ha sido objeto de muchos menos estudios experimentales que T. brucei, desde estudios de la función de proteínas individuales hasta análisis de todo el proteoma. Como ejemplo particularmente relevante, T. brucei ha sido objeto de un estudio de localización de todo el proteoma que emplea etiquetado de proteínas y microscopía9. La capacidad de realizar un estudio de este tipo se ve facilitada por la capacidad de modificar genéticamente fácilmente los PCF de T. brucei, pero ninguno que pueda replicarse para T. congolense en este momento. El análisis de T. congolense aquí presentado tiene aplicación en la curación de proteínas de alto rendimiento. Por ejemplo, aproximadamente 800 proteínas clasificadas en compartimentos subcelulares en T. congolense no contienen anotaciones GO CC seleccionadas basadas en ortólogos 1 a 1 de T. brucei. Además, miles de genes de T. congolense están anotados como pseudogenes. Aproximadamente 1200 de estos se detectaron en el proteoma espacial BSF o PCF, lo que indica una anotación errónea como pseudogenes y permite una mayor corrección de la curación del genoma. Estos conjuntos de datos también brindan información sobre las consecuencias proteómicas de la diversidad genómica entre T. brucei y T. congolense. Por ejemplo, hay muchos ortogrupos expandidos en T. congolense; sin embargo, para la mayoría se desconocía previamente si esto se traducía en una expansión a nivel de proteínas. Aquí, son evidentes varios casos en los que la expansión de la familia de genes se refleja en el nivel de proteínas con múltiples proteínas del mismo ortogrupo detectadas en T. congolense.

Los conjuntos de datos de hyperLOPIT son particularmente poderosos cuando se estudian comparativamente. Los compartimentos subcelulares involucrados en las adaptaciones y la especiación del huésped parásito se revelan mediante el análisis de proteínas específicas de la etapa o aquellas codificadas por genes que eran diversos entre especies, respectivamente. El conjunto específico de la etapa se enriqueció con mitocondrias exclusivamente en PCF, estando representados, por ejemplo, componentes de la cadena de transporte de electrones. Esto refleja fuertemente las diferencias metabólicas entre las etapas de la vida en T. brucei y sugiere que existen diferencias similares dentro de T. congolense64,74.

Este trabajo también destaca el papel clave de los compartimentos relacionados con la superficie en la diversidad de tripanosomas africanos. El compartimento secretor/endocítico colectivo post-ER se reveló como el principal impulsor de las diferencias y divergencias genómicas específicas de la etapa tanto en T. brucei como en T. congolense. El proteoma de superficie representa la interfaz física entre el huésped y estos parásitos. Los mecanismos de defensa específicos del huésped y las oportunidades nutricionales impulsan la evolución y la expresión seleccionada de proteínas de superficie y, en consecuencia, los proteomas de superficie difieren considerablemente entre las etapas de la vida. Los distintos rangos de huéspedes y los distintos microambientes del huésped también ejercerán una presión selectiva diferencial sobre las proteínas de superficie expresadas en cada especie. Por ejemplo, a diferencia de T. brucei, las BSF de T. congolense se adhieren a eritrocitos y células endoteliales in vivo53,54. Esto no sólo requiere la presencia de características bioquímicas que permitan la adherencia, sino que también afecta la disponibilidad nutricional y las tensiones y factores del huésped que se encuentran dentro de este microambiente. La observación del enriquecimiento de proteínas secretoras/endocíticas, que incluyen proteínas de superficie, en conjuntos de proteínas diversos y específicos de la etapa identifica la importancia de estas proteínas en la adaptación evolutiva a los distintos entornos encontrados por cada tipo de célula. En particular, estos conjuntos incluyen numerosas proteínas no caracterizadas y proporcionan un repertorio prometedor de candidatos para los determinantes moleculares de la diversidad de parásitos.

En resumen, se ha empleado hyperLOPIT para mapear espacialmente los proteomas de T. brucei y T. congolense, cada uno en el BSF de los mamíferos y en el PCF del intestino medio del insecto. Estos conjuntos de datos altamente completos no solo proporcionan información rica sobre expresión y localización de miles de proteínas, sino que también revelan los compartimentos subcelulares clave involucrados en la diversidad de parásitos a nivel de etapa de vida y especie.

Se utilizaron células Lister 427 de la cepa T. brucei procedentes del laboratorio de Mark Carrington (Universidad de Cambridge) para las etapas del ciclo de vida de BSF y PCF. Los BSF de T. brucei se mantuvieron en HMI-9 10% FBS (suero bovino fetal) a 37 °C 5% CO2 0,9 × 104 a 1,96 × 106 células/ml. Los PCF de T. brucei se mantuvieron en SDM-79 con FBS al 10 % a 27 °C y CO2 al 5 % de 2,5 x 105 a 1,63 x 107 células/ml. Se utilizaron células de la cepa IL3000 de T. congolense para las etapas del ciclo de vida de BSF y PCF. Las células BSF de T. congolense se obtuvieron del laboratorio de Catarina Gadelha (Universidad de Nottingham), las células PCF de T. congolense se obtuvieron del laboratorio de Mark Carrington (Universidad de Cambridge). Los BSF de T. congolense se mantuvieron en TcBSF-1 10 % GS (suero de cabra) a 37 °C y 5 % CO2 de 1 x 105 a 6,7 ​​x 106 células/ml75. Los PCF de T. congolense se mantuvieron en TcPCF-3 20 % FBS a 27 °C 5 % CO2 de 5 x 105 a 1,6 x 107 células/ml75. Para los experimentos de hyperLOPIT, las células en crecimiento logarítmico se ampliaron en suspensión en matraces de cultivo de 75 cm2 (T175) para todos los tipos de células excepto T. congolense BSF, que se ampliaron en capas adherentes en matraces de 875 cm2 de 5 capas.

Las células en crecimiento logarítmico se recogieron y se lavaron según el tipo de célula de la siguiente manera: (i) T. brucei BSF se recogió mediante centrifugación repetida (10 min 4635 xg 20 °C) con dos o tres lavados de centrifugación (10 min 1693 x g RT) en PBS Voorheis (NaCl 136,9 mM, KCl 3 mM, Na2HPO4 16 mM, KH2PO4 3 mM, sacarosa 45,9 mM, glucosa 10 mM, pH 7,6) seguido de lavado en medio de homogeneización (HM: sacarosa 0,25 M, HEPES 10 mM, KOH pH 7,4, EDTA 1 mM) (ii) Se recogieron PCF de T. brucei mediante centrifugación repetida (10 min 4635 xg 20 °C) con tres lavados de centrifugación (10 min 1693 × g RT) en SDM-79 sin suero seguidos de dos lavados en HM, (iii) BSF de T. congolense se lavaron una vez en el matraz con TcBSF-1 sin suero, seguido de uno o dos lavados en el matraz con HM, se recogieron agitando en suspensión y centrifugación, y seguido de dos lavados de centrifugación. (10 min 1600 xg RT) en HM, y (iv) PCF de T. congolense se recogieron mediante centrifugación repetida (10 min 4635 × g 20 °C) con tres lavados de centrifugación (10 min 1600 × g RT) en TcPCF sin suero -3 siguió a dos lavados en HM. Finalmente, cada tipo de célula se suspendió en HM enfriada suplementada con inhibidores de proteasa (cóctel completo de inhibidor de proteinasa sin EDTA, Roche) a una densidad de 4 × 108/ml.

Las células se lisaron mediante cavitación con nitrógeno (recipiente de disrupción celular modelo 4639, Parr Instrument Company) de acuerdo con otros trabajos28,34,76. Brevemente, la suspensión celular se cargó en el recipiente previamente enfriado que se cargó a 350–850 psi y se incubó durante 15 minutos antes de la liberación del lisado a 1–2 gotas/segundo. El lisado se llevó inmediatamente a acetato de magnesio tetrahidrato 2 mM y se agregaron 500 U de benzonasa (Merck), seguido de 20 min de incubación a temperatura ambiente y 10 min de incubación en hielo. Las células no lisadas se eliminaron mediante cuatro centrifugaciones (5 minutos a 200 xg RT) para producir el lisado celular clarificado. Más detalles están disponibles en Datos complementarios 1.

El fraccionamiento subcelular se realizó como se describió anteriormente con algunas modificaciones23,28. Primero, las membranas crudas se enriquecieron con un cojín de iodixanol mediante el cual el lisado celular se cubrió con soluciones de iodixanol al 6% y al 25% en HM y se centrifugó a 146.498 × g en un rotor SW40 Ti (Beckman Coulter) o 100.095 × g en un rotor SW55 Ti. (Beckman Coulter) a 4 °C durante 1,5 h. Se recogió una alícuota de la parte superior del cojín y se tomó como fracción soluble. Las membranas crudas se enriquecieron en dos bandas visibles en las interfaces entre las capas de iodixanol. Estos se recogieron utilizando una pipeta Pasteur, se diluyeron con HM y se sedimentaron mediante centrifugación a 200.309 × g en un rotor SW55 Ti (Beckman Coulter) a 4 ° C durante 1 h. Las membranas crudas granuladas se suspendieron en una solución de yodixanol al 32% en HM con 10 golpes de un homogeneizador Dounce (Pestle B 885300-0002, Kimble-Chase, distancia de limpieza de 0,0127–0,0635 mm). Luego, las membranas crudas suspendidas se colocaron debajo de un gradiente de iodixanol preformado compuesto por etapas secuenciales de solución de iodixanol en HM (20 %, 23 %, 26 % y 29 % de iodixanol) que se había dejado difundir durante la noche a 4 °C. Después de la colocación, el gradiente se centrifugó a 99.820 x g en un rotor VTi65.1 (Beckman Coulter) a 4 °C durante 12 h. El gradiente se recogió en fracciones perforando el fondo seguido del cuello y recogiendo la solución gota a gota desde el fondo en aproximadamente 22 fracciones de 0,5 ml. Después de la recolección, se midió el Ri (índice de refracción) para cada fracción usando un refractómetro (Bellingham Stanley) y se midió el contenido de proteína mediante el ensayo de Bradford. Las fracciones se almacenaron a -80 °C o se procesaron inmediatamente para la extracción de proteínas.

La proteína se extrajo de la fracción soluble mediante la adición de 4-5 veces el volumen de acetona enfriada con hielo. La proteína se extrajo de las fracciones del gradiente que contenían iodixanol mediante precipitación con TCA (ácido tricloroacético), mediante la cual las fracciones se ajustaron a ~10-15% de TCA para precipitar la proteína, seguido de lavados con TCA al 10% y lavados con acetona. Durante los lavados con acetona, los pellets se sometieron a sonicación (5 ciclos de 30 s ON/OFF a alta potencia, desintegrador ultrasónico Bioruptor Plus, Diagenode). Luego, todas las muestras se solubilizaron en tampón TEAB (bicarbonato de trietilamonio) 100 mM (pH 8,5) con SDS (dodecilsulfato de sodio) al 0,2% y urea 8 M y se sometieron a sonicación repetida. El contenido de proteínas se midió mediante el ensayo de BCA (ácido bicinconínico). Las fracciones (carga de 0,2 o 0,4 µg) se analizaron mediante transferencia Western utilizando métodos estándar con anticuerpos contra un panel de proteínas marcadoras del compartimento. Los anticuerpos (anti-ISG65, anti-MI.2 C D88 (VSG221) y anti-DHH1) se obtuvieron del laboratorio de Mark Carrington (Universidad de Cambridge). Los anticuerpos (anti-BiP, anti-CatL y anti-mtHSP70) se obtuvieron del laboratorio de James Bangs (Universidad de Buffalo). Los anticuerpos (anti-Histona H3 (ab1791), anti-IgG H&L de rata (HRP) (ab97057) y anti-IgG H&L de conejo (HRP) (ab6721)) se obtuvieron comercialmente de Abcam y anti-Tubulin [YL1/2] (ab6160 /MAB1864) procedía de Abcam y Sigma-Aldrich respectivamente. Los anticuerpos se utilizaron en aproximadamente las siguientes diluciones: anti-ISG65 (5000), anti-MI.2 C D88 (VSG221) (50000), anti-DHH1 (5000), anti-BiP (1500000), anti-CatL (5000- 10000), anti-mtHSP70 (10000), anti-Histona H3 (1000-5000), anti-Tubulina [YL1/2] (1500-2000), anti-IgG de rata H&L (HRP) (20000) e anti-IgG de conejo H&L (HRP) (30000). Tenga en cuenta que en todos los casos, una vez diluidos en la solución bloqueadora, los anticuerpos se almacenaron y reutilizaron.

Para cada experimento, se concatenaron fracciones de gradiente para formar 10 grupos (30–98 µg). La concatenación de fracciones se guió mediante análisis de transferencia Western para maximizar la resolución del compartimento subcelular en ejecuciones individuales mientras se variaba la resolución entre ejecuciones cuando fuera posible, con la restricción de la disponibilidad de proteínas. Se formó una undécima muestra con la fracción soluble. Las muestras se redujeron, alquilaron y tripsinizaron según Barylyuk et al. (2020). Después de la tripsinación, los péptidos se cuantificaron para todas las series excepto para la iteración n.° 1 de BSF de T. brucei (ensayo de péptidos fluorimétrico cuantitativo de Pierce) y la cantidad de péptidos se normalizó para todos los grupos de fracciones. Se marcaron péptidos (20-56 µg) con etiquetas TMT-11plex (A37725 o 90111 suplementadas con A37724, Thermo Fisher Scientific). Brevemente, se suspendieron 0,8 mg de etiquetas equilibradas a temperatura ambiente en acetonitrilo (41-90 µl) y se agregaron (20,5-41 µl) a la mezcla de péptidos (54-115 µl) creando condiciones a 1X o 0,5X la cantidad de TMT según la instrucciones del fabricante. Se dejó que la reacción prosiguiera durante 2 h a 25 °C con agitación (800 rpm, Eppendorf ThermoMixer) antes de añadir 8 µl de hidroxilamina al 5 % (v/v) con incubación durante 1 h a 25 °C con agitación (800 rpm). ). Luego se agruparon las muestras marcadas con TMT y se redujeron hasta sequedad mediante centrifugación al vacío refrigerada (Labconco).

Las piscinas de TMT fueron desalinizadas con la modificación de Mulvey et al. (2017) utilizando el cartucho de luz Sep-Pak tC18 Plus (WAT036805, Waters). Brevemente, utilizando una jeringa, se acondicionaron los cartuchos con 2 ml de acetonitrilo, 2 ml de tampón de elución (70% acetonitrilo, 0,05% ácido acético), 2 ml de tampón desalinizador (0,05% ácido acético) y 4 ml de tampón de carga (0,1% TFA (trifluoroacético). ácido)). Se cargaron péptidos (suspendidos en TFA al 0,1 % ajustado a aproximadamente pH 2) en los cartuchos, seguido de 4 ml de tampón de carga y 4 ml de tampón de desalación. Los péptidos se eluyeron en 1,6 ml de tampón de elución y se redujeron hasta sequedad mediante centrifugación al vacío refrigerada. Los péptidos desalados se fraccionaron mediante cromatografía de fase inversa a pH alto según Mulvey et al. (2017) utilizando un sistema UPLC Waters Acquity con una columna BEH C18 (1,7 μm, 2,1 × 150 mm) y una precolumna VanGuard BEH C18 (1,7 μM, 2,1 × 5 mm)23.

Todas las series de MS se realizaron en un instrumento Orbitrap FusionTM LumosTM TribridTM acoplado a un sistema Dionex UltimateTM 3000 RSLCnano (Thermo Fisher Scientific). Las fracciones de UPLC se concatenaron en 17-19 grupos y cada una se resuspendió en 20 µl de ácido fórmico al 0,1 % (v/v) y se cargó aproximadamente 1 µg de péptidos por inyección para el análisis LC-MS/MS. El método de cromatografía líquida de nanoflujo para el análisis LC-MS/MS se configuró según el trabajo anterior23. Los parámetros del flujo de trabajo de MS con XCalibur (v3.0.63) también fueron los del trabajo anterior, con la excepción de la resolución de Orbitrap que se configuró en 50,00023.

La identificación y cuantificación de péptidos se realizó en ProteomeDiscoverer (v2.4) con Mascot (v2.7.0, Matrix Science) utilizando bases de datos de secuencias de TriTrypDB (v50) según las especies: T. brucei (TREU927 con genes Lister 427 BES40 adjuntos), T. congolense (IL3000 2019). Las bases de datos de contaminantes incluían (i) un cRAP (repositorio común de proteínas adventicias) GPM (Global Proteome Machine) ampliado de CamProtR (v0.0.0.9000, github.com/CambridgeCentreForProteomics/camprotR) con Benzonase (P1371769) adjunto, y (ii) la base de datos cRFP (Repositorio común de proteínas FBS)77. Las tolerancias de error de precursor y fragmento de masa se establecieron en 10 ppm 0,6 Da respectivamente, los iones indicadores se cuantificaron utilizando el método de centroide más confiable y la tripsina se estableció como la enzima de elección con un máximo de 2 escisiones omitidas. Las modificaciones estáticas incluyeron: carbamidometilo (C), TMT6plex (N-term) y TMT6plex (K). Las modificaciones dinámicas incluyeron: Desamidado (NQ), Oxidación (M), TMT6plex (S) y TMT6plex (T). Se utilizó un percolador para evaluar la FDR (tasa de descubrimiento falso) y solo se retuvieron los péptidos de alta confianza. Se exportaron datos a nivel de PSM y los identificadores se convirtieron en identificadores de genes según el encabezado fasta. Los datos se procesaron adicionalmente en R con los siguientes parámetros: Número de grupos de proteínas = 1; Rango = 1; Clasificación del motor de búsqueda = 1; Intensidad > 1e3; S/N promedio del reportero > = 5; Interferencia de aislamiento <= 50%32. Se eliminaron los PSM que coincidían con los contaminantes (cRAP y cRFP) y aquellos con valores faltantes en cualquiera de los canales de cuantificación TMT de 11 plex. Las intensidades de PSM se normalizaron por suma y luego se agregaron mediante mediana al nivel de proteína. Luego, cada experimento de TMT de 11 complejos se concatenó para formar un conjunto de datos de 33 complejos y se eliminaron las proteínas con valores faltantes en cualquiera de los experimentos35.

La inspección y el análisis de datos se realizaron en R (v4.1.0) predominantemente utilizando los paquetes Bioconductor MSnbase (v2.18.0), pRoloc (v1.32.0), tidyverse (v1.3.1), clusterProfiler (v4.0.5) y ggplot2 (v3.3.3). )25,26,27,78,79,80,81,82. Se importaron conjuntos de datos hiperLOPIT de 33 plex normalizados y se sometieron a reducción de dimensionalidad mediante t-SNE según Barylyuk et al. (2020)28,38. La agrupación no supervisada se realizó con el algoritmo HDBSCAN utilizando la biblioteca hdbscan (v0.8.19) de Python (v3.7.1) en conjuntos de datos hiperLOPIT normalizados40,83. Se utilizaron los parámetros predeterminados excepto los siguientes: muestras mínimas = 8; tamaño mínimo del grupo = 9; método de selección de conglomerados = 'hoja'; generar árbol de expansión mínimo = VERDADERO.

Para el desarrollo de marcadores de T. brucei, se preparó un conjunto de proteínas marcadoras inicial mediante revisión manual de la literatura y anotación GO CC guiada por información de agrupamiento HDBSCAN e inspección visual de los perfiles de distribución de abundancia de proteínas. También se realizó una revisión automatizada de la literatura para detectar evidencia de localización de los miembros del grupo HDBSCAN utilizando la API ScienceDirect (https://www.elsevier.com/solutions/sciencedirect/librarian-resource-center/api) con la biblioteca elsapy de Python (v3.7.1). (v0.5.0). Se excluyeron las proteínas que parecían ser atípicas o que se desplazaban entre etapas de la vida y se utilizaron los mismos marcadores para T. brucei BSF y PCF. Para el desarrollo de los marcadores de T. congolense, se preparó un conjunto de marcadores inicial tomando los ortólogos de los marcadores de T. brucei o las asignaciones de TAGM-MAP (la localización compartimental más probable de cada proteína realizada con TAGM-MAP; ver más abajo). que tenía evidencia de localización de apoyo en T. brucei. Luego, estos se seleccionaron adicionalmente guiados por la agrupación HDBSCAN y la inspección visual de los perfiles de distribución de abundancia de proteínas. Este conjunto de marcadores inicial se utilizó para el análisis semisupervisado de Novedad-TAGM para permitir el descubrimiento de cualquier compartimento no marcado como fenotipo, además de la asignación de proteínas a compartimentos definidos46. Los parámetros de la novedad TAGM se establecieron por defecto y el algoritmo se ejecutó durante 10 000 iteraciones, 5000 se descartaron automáticamente, la reducción se estableció en 10 y se ejecutaron 9 cadenas independientes. Los resultados del análisis Novedad-TAGM se inspeccionaron en busca de nuevos fenotipos que representaran nichos subcelulares resueltos y expansiones en compartimentos existentes para marcadores candidatos adicionales basados ​​en evidencia de localización en ortólogos de T. brucei. Debido a la resolución diferencial de varios compartimentos entre BSF y PCF, en T. congolense se utilizaron los mismos marcadores pero con fusión/partición diferencial de subcompartimentos.

Las predicciones de localización de proteínas se generaron basándose en el modelo TAGM26,33. Las clasificaciones TAGM-MAP de los conjuntos de datos de 33 complejos son las clasificaciones principales y forman la base de los proteomas espaciales informados en este trabajo. Los parámetros del modelo TAGM-MAP se generaron utilizando la configuración predeterminada para determinar la asignación posterior y las probabilidades de valores atípicos de cada proteína. Cada proteína no marcadora se asignó a un compartimento que representa la localización más probable de todos los compartimentos. La probabilidad de localización se calculó como el producto de la probabilidad de asignación y el complemento de la probabilidad del valor atípico (\(P({localización})=P({asignación})\times (1-P({outlier}))\)) . Luego se generaron clasificaciones aplicando dos umbrales a estas asignaciones: probabilidad de localización >0,999 y, por separado, una probabilidad de valor atípico <5 E-5. Las proteínas que no cumplieron con los criterios de umbral fueron designadas como "desconocidas". Para evaluar la reproducibilidad de las clasificaciones producidas por iteraciones experimentales individuales, también se realizó TAGM-MAP con la configuración predeterminada en cada conjunto de datos de 11 plex por separado. Las clasificaciones se mantuvieron si excedían una probabilidad de localización >0,99. Para evaluar la variabilidad en la clasificación entre los experimentos, los conjuntos de datos se compararon por pares utilizando el índice Rand ajustado que asigna una puntuación de 0 si la consistencia es lo que se espera al azar y 1 para una consistencia perfecta usando el paquete R mmclust (v1.0.1)47. Para evitar inflar o deflactar el ARI debido a un exceso de asignaciones “desconocidas”, estas se filtraron antes de compararlas. Luego se utilizó el análisis utilizando TAGM-MCMC para proporcionar información sobre proteínas que se desconocían según TAGM-MAP y que podrían deberse a la localización dinámica de proteínas. Este modelo se implementó utilizando la cadena de Markov Monte-Carlo. El muestreador de Gibbs colapsado se ejecutó en paralelo durante 9 cadenas (T. brucei) y 4 cadenas (T. congolense) y cada cadena se ejecutó durante 10,000 iteraciones. La convergencia se evaluó mediante el diagnóstico de Gelman-Rubin y se conservaron todas las cadenas de Markov para T. congolense; mientras que para T. brucei se conservaron las dos mejores cadenas. No se aplicó ningún criterio de umbral con las asignaciones de proteínas y se informan las probabilidades conjuntas de los compartimentos. Se utilizaron probabilidades conjuntas para evaluar proteínas que pueden exhibir localización en más de un compartimento.

La anotación de características de proteínas se tomó predominantemente de TriTrypDB (descargado el 06/01/2021) para características que incluyen nombres de proteínas, descripciones, pesos moleculares, dominios TM, péptidos señal, términos GO y descripciones de Pfam43. La presencia del anclaje GPI se predijo utilizando NetGPI en línea (v1.1, services.healthtech.dtu.dk/service.php?NetGPI) con secuencias de TriTrypDB (v50) como se usa para todos los análisis proteómicos44. Los valores de pI (punto isoeléctrico) de la proteína se predijeron con pIR (v0.99.0) usando el método Bjell usando secuencias de TriTrypDB (v50) como se usa para todos los análisis proteómicos41,42. Las predicciones de localización subcelular de DeepLoc (v1.0) se generaron localmente en Python (v3.7.1) utilizando parámetros de modelo precalculados disponibles en línea (https://services.healthtech.dtu.dk/software.php)48. Las secuencias para DeepLoc se obtuvieron de TriTrypDB de la siguiente manera: T. brucei TREU927 (descargado el 28/02/2021) con genes BES40 añadidos de los utilizados para todos los análisis proteómicos (v50); T. congolense IL3000 2019 (descargado el 03/01/2021).

La inferencia de grupos ortólogos (OG) entre T. brucei (TREU927 suplementado con genes Lister 427 BES40), T. congolense (IL3000 2019), T. vivax (Y486) y T. cruzi (similar a CL Brener Esmeraldo) se realizó utilizando OrthoFinder 2.5.2 suministrando un árbol de especies fijas (Figura 9 complementaria) y con la opción -y para dividir los OG en OG jerárquicos (hOG) basándose en la conciliación automatizada de árboles84. Todos los proteomas se obtuvieron de TriTrypDB (v50)43. Las búsquedas de similitud se realizaron utilizando BLAST (opción -S blast). Cualquier gen específico de especie que comúnmente se excluye del resultado de OrthoFinder se agregó por separado como OG de un solo gen. Además, la inspección de los hOG reveló una división excesiva de varios de los OG originales, que se corrigieron manualmente (Datos complementarios 11). Por lo tanto, se utilizaron identificadores hOG corregidos como índice. Se agregó una anotación adicional (Datos complementarios 11): (i) perfil filogenético: perfil binario de presencia/ausencia de genes en un hOG determinado en cada especie, (ii) origen: el nodo de origen ancestral de hOG inferido (N0-N6, consulte la figura complementaria . 9), (iii) la representación categórica (pérdida/ninguna/una/dos/muchas) del recuento de genes en un hOG determinado para cada especie (la pérdida sólo puede inferirse en los casos en que genes de al menos dos especies están presentes en un hOG) y iv) la representación categórica (pérdida/ninguna/uno/dos/muchos) del recuento de genes en un hOG determinado específicamente para T. brucei-to-T. congoleño. Los identificadores de Fasta se convirtieron en identificadores de genes basados ​​en los encabezados de fasta del proteoma TriTrypDB de origen.

Para definir las proteínas específicas de una etapa, se compilaron listas de proteínas únicas de una etapa determinada en comparación con la otra etapa de la misma especie y se denominan como tales. El conjunto de proteínas diversificado se desarrolló basándose en genes codificantes en ortogrupos expandidos y específicos de especie definidos de la siguiente manera: (i) específicos de especie: ortogrupos solo presentes en las especies indicadas, y (ii) expandidos: ortogrupos con >=2 veces el número de genes versus su contraparte en T. brucei o T. congolense en consecuencia. Casos de ortogrupos de recuento de dos genes en T. brucei-T. congolense donde dos identificadores de encabezado fasta coincidentes con un único identificador de gen se eliminaron de este conjunto en T. brucei.

El análisis de enriquecimiento se realizó utilizando la función 'enriquecedora' clusterProfiler (v4.0.5) con configuraciones predeterminadas82 (prueba hipergeométrica p < 0,05 con ajuste de Benjamini y Hochberg) para pruebas de: (i) enriquecimiento de términos GO CC en todas las proteínas o en proteínas no marcadoras en cada compartimento subcelular contra el fondo del proteoma correspondiente, (ii) enriquecimiento de los compartimentos LOPIT en proteínas específicas de etapa o conjunto de genes diversos contra el fondo del proteoma correspondiente y (iii) enriquecimiento de anotaciones de origen hOG en cada compartimento LOPIT contra el fondo del proteoma correspondiente.

Cada uno de los conjuntos de datos finales de 33 complejos por tipo de celda se compone de tres iteraciones concatenadas de 11 complejos del procedimiento experimental y luego se utilizaron estadísticas bayesianas para analizar los datos concatenados. Para obtener más detalles, consulte la Nota complementaria. Las proteínas con un valor faltante en cualquiera de los 33 puntos de datos por tipo de célula se excluyeron de análisis adicionales. Las características de las proteínas se examinaron según grupos no supervisados, compartimentos subcelulares, especificidad del tipo de célula y diversidad de especies mediante análisis de enriquecimiento. No se utilizaron métodos estadísticos para predeterminar los tamaños de muestra. Los experimentos no fueron aleatorios. Los investigadores no estaban cegados a la asignación durante los experimentos y la evaluación de resultados.

Los datos de proteómica de EM generados en este estudio se depositaron en el Consorcio ProteomeXchange a través del repositorio de socios PRIDE con el identificador de datos PXD03542685. Las versiones interactivas de cada conjunto de datos se pueden ver en línea a través de aplicaciones R shiny en https://proteome.shinyapps.io/tbrucei_bsf/, https://proteome.shinyapps.io/tbrucei_pcf/, https://proteome.shinyapps.io/ tcongolense_bsf/ y https://proteome.shinyapps.io/tcongolense_pcf/. Cada proteoma espacial también está integrado con TriTrypDB (https://tritrypdb.org/tritrypdb/app)43. Los conjuntos de datos también están disponibles en el paquete R pRolocdata versión 1.37.1. en https://bioconductor.org/packages/release/data/experiment/html/pRolocdata.html25,86. Más información y solicitudes de recursos y reactivos deben dirigirse a la autora correspondiente, Paula MacGregor ([email protected]), que será atendida por ella. Los datos originales se proporcionan con este documento.

Morrison, LJ, Vezza, L., Rowan, T. & Hope, JC Tripanosomiasis africana animal: es hora de centrarse más en especies de parásitos y huéspedes clínicamente relevantes. Tendencias Parasitol. 32, 599–607 (2016).

Artículo PubMed Google Scholar

Bargul, JL et al. Adaptaciones específicas de especie de la morfología y motilidad del tripanosoma al huésped mamífero. Patógeno PLoS. 12, e1005448 (2016).

Artículo PubMed PubMed Central Google Scholar

Hemphill, A., Frame, I. y Ross, CA La interacción de Trypanosoma congolense con células endoteliales. Parasitología 109, 631–641 (1994).

Artículo PubMed Google Scholar

Lane-Serff, H. et al. Diversificación evolutiva del receptor de haptoglobina-hemoglobina del tripanosoma a partir de un receptor de hemoglobina ancestral. Elife 5, e13044 (2016).

Artículo PubMed PubMed Central Google Scholar

Taylor, K. y Authie, EML Patogénesis de la tripanosomiasis animal. En Las tripanosomiasis, CABI Publishing. (Eds Maudlin, I. Holmes, PH y Miles, MA) (2004).

Vickerman, K. Ciclos de desarrollo y biología de tripanosomas patógenos. Hno. Medicina. Toro. 41, 105-114 (1985).

Artículo CAS PubMed Google Scholar

Eh, WK et al. Análisis global de la localización de proteínas en levaduras en ciernes. Naturaleza 425, 686–691 (2003).

Artículo ADS CAS PubMed Google Scholar

Thul, PJ y Lindskog, C. El atlas de proteínas humanas: un mapa espacial del proteoma humano. Ciencia de las proteínas. 27, 233–244 (2018).

Artículo CAS PubMed Google Scholar

Billington, K. y col. Mapa de proteínas subcelulares de todo el genoma del parásito flagelado Trypanosoma brucei. Nat. Micro. 8, 533–547 (2023).

Artículo CAS Google Scholar

Niemann, M. y col. El proteoma de la membrana externa mitocondrial de Trypanosoma brucei revela nuevos factores necesarios para mantener la morfología mitocondrial. Mol. Celúla. Proteoma. 12, 515–528 (2013).

Artículo CAS Google Scholar

Güther, MLS, Urbaniak, MD, Tavendale, A., Prescott, A. y Ferguson, MA Proteoma de glicosomas de alta confianza para la forma procíclica Trypanosoma brucei mediante enriquecimiento de orgánulos con etiquetas de epítopos y proteómica SILAC. J. Proteoma Res. 13, 2796–2806 (2014).

Artículo PubMed PubMed Central Google Scholar

Goos, C., Dejung, M., Janzen, CJ, Butter, F. y Kramer, S. El proteoma nuclear de Trypanosoma brucei. MÁS UNO 12, e0181884 (2017).

Artículo PubMed PubMed Central Google Scholar

Subota, I. et al. El análisis proteómico de flagelos intactos de células procíclicas de Trypanosoma brucei identifica nuevas proteínas flagelares con una sublocalización y una dinámica únicas. Mol. Celúla. Proteoma. 13, 1769-1786 (2014).

Artículo CAS Google Scholar

Peikert, CD y cols. Trazado de importamos organelos mediante espectrometría de masas cuantitativa. Nat. Comunitario. 8, 1-14 (2017).

Artículo de Google Scholar

Geladaki, A. y col. Combinando LOPIT con ultracentrifugación diferencial para proteómica espacial de alta resolución. Nat. Comunitario. 10, 331 (2019).

Artículo ADS PubMed PubMed Central Google Scholar

Christoforou, A. et al. Un borrador de mapa del proteoma espacial de células madre pluripotentes de ratón. Nat. Comunitario. 7, 8992 (2016).

Artículo PubMed Google Scholar

Itzhak, DN, Tyanova, S., Cox, J. & Borner, GH Mapeo global, cuantitativo y dinámico de la localización subcelular de proteínas. vida 5, e16950 (2016).

Artículo PubMed Google Scholar

Orre, LM y cols. SubCellBarCode: mapeo de localización y relocalización de proteínas en todo el proteoma. Mol. Celda 73, 166–182. e167 (2019).

Artículo CAS PubMed Google Scholar

Beltran, PMJ, Mathias, RA & Cristea, IM Un retrato del proteoma del orgánulo humano en el espacio y el tiempo durante la infección por citomegalovirus. Sistema celular. 3, 361–373. e366 (2016).

Artículo de Google Scholar

Jadot, M. y col. Contabilización de la localización subcelular de proteínas: un mapa compartimental del proteoma del hígado de rata. Mol. Celúla. Proteoma. 16, 194-212 (2017).

Artículo CAS Google Scholar

Dunkley, TP y cols. Mapeo del proteoma del orgánulo de Arabidopsis. Proc. Acad. Nacional. Ciencia. Estados Unidos 103, 6518–6523 (2006).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Foster, LJ y cols. Un mapa de orgánulos de mamíferos mediante perfiles de correlación de proteínas. Celda 125, 187-199 (2006).

Artículo CAS PubMed Google Scholar

Mulvey, CM y cols. Uso de hyperLOPIT para realizar un mapeo de alta resolución del proteoma espacial. Nat. Protocolo. 12, 1110-1135 (2017).

Artículo CAS PubMed Google Scholar

Breckels, LM y cols. El efecto del descubrimiento de orgánulos sobre la localización de proteínas subcelulares. J. Proteoma. 88, 129-140 (2013).

Artículo CAS Google Scholar

Gatto, L., Breckels, LM, Wieczorek, S., Burger, T. y Lilley, KS Análisis de datos de proteómica espacial basado en espectrometría de masas utilizando pRoloc y pRolocdata. Bioinformática 30, 1322-1324 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Crook, OM, Breckels, LM, Lilley, KS, Kirk, PDW y Gatto, L. Un flujo de trabajo de bioconductores para el análisis bayesiano de proteómica espacial. F1000Investigación 8, 446 (2019).

Artículo PubMed PubMed Central Google Scholar

Breckels, LM, Mulvey, CM, Lilley, KS y Gatto, L. Un flujo de trabajo de bioconductores para procesar y analizar datos de proteómica espacial. F1000Investigación 5, 2926 (2016).

Artículo PubMed Google Scholar

Barylyuk, K. et al. Un atlas subcelular completo del proteoma de toxoplasma a través de hyperLOPIT proporciona un contexto espacial para las funciones de las proteínas. Microbio huésped celular 28, 752–766.e759 (2020).

Artículo CAS PubMed Central Google Scholar

Nightingale, DJ, Geladaki, A., Breckels, LM, Oliver, SG y Lilley, KS La organización subcelular de Saccharomyces cerevisiae. actual. Opinión. Química. Biol. 48, 86–95 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Tan, DJ y cols. Mapeo de proteínas de orgánulos y complejos proteicos en Drosophila melanogaster. J. Proteoma Res. 8, 2667–2678 (2009).

Artículo CAS PubMed Google Scholar

Levin, M., Scheibe, M. & Butter, F. Anotación de genes asistida por proteotranscriptómica y proteómica espacial de la línea celular Bombyx mori BmN4. BMC Genomics 21, 690 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Mulvey, CM y cols. Perfil proteómico espaciotemporal de la respuesta proinflamatoria al lipopolisacárido en la línea celular de leucemia humana THP-1. Nat. Comunitario. 12, 1-19 (2021).

ADS del artículo Google Scholar

Crook, OM, Mulvey, CM, Kirk, PDW, Lilley, KS y Gatto, L. Un enfoque de modelado de mezclas bayesianas para proteómica espacial. Computación PLoS. Biol. 14, e1006516 (2018).

Artículo ADS PubMed PubMed Central Google Scholar

Hauser, R., Pypaert, M., Hausler, T., Horn, EK y Schneider, A. Importación in vitro de proteínas a las mitocondrias de Trypanosoma brucei y Leishmania tarentolae. J. Ciencia celular. 109, 517–523 (1996).

Artículo CAS PubMed Google Scholar

Trotter, MW, Sadowski, PG, Dunkley, TP, Groen, AJ y Lilley, KS Resolución subcelular mejorada mediante el análisis simultáneo de datos proteómicos de orgánulos en diversas condiciones experimentales. Proteómica 10, 4213–4219 (2010).

Artículo CAS PubMed Google Scholar

Holmes, S. y Huber, W. Estadística moderna para la biología moderna (Cambridge University Press, 2019).

Nguyen, LH y Holmes, S. Diez consejos rápidos para una reducción eficaz de la dimensionalidad. Computación PLoS. Biol. 15, e1006907 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Van der Maaten, L. y Hinton, G. Visualización de datos mediante t-SNE. J. Mach. Aprender. Res. 9, 2579–2605 (2008).

de Duve, C. Fracción de tejido: pasado y presente. J. Biol celular. 50, 20 (1971).

Artículo PubMed PubMed Central Google Scholar

Campello, RJGB, Moulavi, D. & Sander, J. En Avances en el descubrimiento de conocimientos y la minería de datos. pag. 160-172 (Springer Berlín Heidelberg, 2013).

Pérez-Riverol, Y. et al. Optimización del punto isoeléctrico mediante descriptores peptídicos y máquinas de vectores de soporte. J. Proteoma. 75, 2269–2274 (2012).

Artículo CAS Google Scholar

Audain, E., Ramos, Y., Hermjakob, H., Flower, DR y Perez-Riverol, Y. Estimación precisa del punto isoeléctrico de proteínas y péptidos basada en secuencias de aminoácidos. Bioinformática 32, 821–827 (2016).

Artículo CAS PubMed Google Scholar

Aslett, M. y col. TriTrypDB: un recurso genómico funcional para Trypanosomatidae. Ácidos nucleicos res. 38, D457–D462 (2010).

Artículo CAS PubMed Google Scholar

Gíslason, MH, Nielsen, H., Almagro Armenteros, JJ & Johansen, AR Predicción de proteínas ancladas a GPI con redes neuronales de puntero. actual. Res. Biotecnología. 3, 6-13 (2021).

Artículo de Google Scholar

Kurotani, A. et al. Las distribuciones específicas de localización de la proteína pI en el proteoma humano se rigen por el pH local y la carga de la membrana. BMC Mol. Biol celular. 20, 36 (2019).

Artículo PubMed PubMed Central Google Scholar

Crook, OM y cols. Un enfoque bayesiano semisupervisado para la asignación simultánea de localización subcelular de proteínas y detección de novedades. Computación PLoS. Biol. 16, e1008288 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Hubert, L. y Allemand, P. Comparación de particiones. J. Clasificación. 2, 193–218 (1985).

Artículo MATEMÁTICAS Google Scholar

Almagro Armenteros, JJ, Sønderby, CK, Sønderby, SK, Nielsen, H. & Winther, O. DeepLoc: predicción de la localización subcelular de proteínas mediante aprendizaje profundo. Bioinformática 33, 3387–3395 (2017).

Artículo PubMed Google Scholar

Ramakrishnan, S., Asady, B. y Docampo, R. Sitios de contacto de la membrana acidocalcisoma-mitocondria en Trypanosoma brucei. Patógenos 7, 33 (2018).

Artículo PubMed PubMed Central Google Scholar

Csordás, G. et al. MICU1 controla tanto el umbral como la activación cooperativa del uniportador de Ca2+ mitocondrial. Metabolismo celular. 17, 976–987 (2013).

Artículo PubMed PubMed Central Google Scholar

Moosavi, B., Berry, EA, Zhu, X.-L., Yang, W.-C. y Yang, G.-F. El ensamblaje de la succinato deshidrogenasa: una enzima clave en bioenergética. Celúla. Mol. Ciencias de la vida. 76, 4023–4042 (2019).

Artículo CAS PubMed Google Scholar

Verner, Z. y col. Mitocondria maleable de Trypanosoma brucei. En t. Rev. Cell Mol. Biol. 315, 73-151 (2015).

Artículo CAS PubMed Google Scholar

Banks, KL Unión de Trypanosoma congolense a las paredes de pequeños vasos sanguíneos. J. Protozoo. 25, 241–245 (1978).

Artículo CAS PubMed Google Scholar

Banks, KL Unión in vitro de Trypanosoma congolense a eritrocitos. J. Protozoo. 26, 103-108 (1979).

Artículo CAS PubMed Google Scholar

Sunter, JD y Gull, K. La zona de unión del flagelo: 'el regente celular' de la morfología del tripanosoma. Tendencias Parasitol. 32, 309–324 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Zhou, Q., An, T., Pham, KT, Hu, H. & Li, Z. La proteína CIF1 es un maestro orquestador de la citocinesis del tripanosoma que recluta varios reguladores de la citocinesis en el sitio de inicio de la citocinesis. J. Biol. Química. 293, 16177–16192 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Hu, H., An, T., Kurasawa, Y., Zhou, Q. & Li, Z. Las proteínas específicas del tripanosoma FPRC y CIF4 regulan el inicio de la citocinesis mediante el reclutamiento de CIF1 en el sitio de inicio de la citocinesis. J. Biol. Química. 294, 16672–16683 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

McAllaster, MR y cols. Identificación proteómica de nuevas proteínas citoesqueléticas asociadas con TbPLK, un regulador esencial de la morfogénesis celular en Trypanosoma brucei. Mol. Biol. Celda 26, 3013–3029 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Jackson, AP y cols. Un filoma de superficie celular para tripanosomas africanos. PLoS Negl. tropo. Dis. 7, e2121 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Wheeler, RJ, Scheumann, N., Wickstead, B., Gull, K. & Vaughan, S. La citocinesis en T rypanosoma brucei difiere entre las formas de tripomastigote del torrente sanguíneo y la mosca tsetsé: implicaciones para la morfogénesis basada en microtúbulos y el análisis de mutantes. Mol. Microbiol. 90, 1339-1355 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Wheeler, RJ, Gull, K. & Sunter, JD Coordinación del ciclo celular en tripanosomas. Año. Rev. Microbiol. 73, 133-154 (2019).

Artículo CAS PubMed Google Scholar

Fritz, M. y col. Nuevos conocimientos sobre los gránulos de RNP mediante el empleo del esqueleto de microtúbulos del tripanosoma como tamiz molecular. Ácidos nucleicos res. 43, 8013–8032 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Kramer, S., Marnef, A., Standart, N. y Carrington, M. La inhibición de la maduración del ARNm en tripanosomas provoca la formación de nuevos focos en la periferia nuclear que contienen reguladores citoplasmáticos del destino del ARNm. J. Ciencia celular. 125, 2896–2909 (2012).

CAS PubMed PubMed Central Google Académico

Zíková, A., Verner, Z., Nenarokova, A., Michels, PAM y Lukeš, J. Un cambio de paradigma: los mitoproteomas del Trypanosoma brucei procíclico y del torrente sanguíneo son comparativamente complejos. PLOS Patog. 13, e1006679 (2017).

Artículo PubMed PubMed Central Google Scholar

Conte, L. y Zara, V. La proteína rieske hierro-azufre: importación y ensamblaje en el complejo citocromo de las mitocondrias de levadura. Bioinorg. Química. Aplica. 2011, 1–9 (2011).

Artículo de Google Scholar

Vanhollebeke, B. y col. Un receptor de haptoglobina-hemoglobina transmite inmunidad innata al Trypanosoma brucei en humanos. Ciencia 320, 677–681 (2008).

Artículo ADS CAS PubMed Google Scholar

Macleod, OJ et al. Un receptor para el factor H, regulador del complemento, aumenta la transmisión de tripanosomas a la mosca tsetsé. Nat. Comunitario. 11, 1-12 (2020).

Artículo de Google Scholar

Moro-Bulnes, A. et al. Contribución de la citidina desaminasa a la biosíntesis de timidilato en Trypanosoma brucei: localización intracelular y propiedades de la enzima. Msphere 4, e00374–00319 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

UniProt. UniProt: la base de conocimiento universal sobre proteínas en 2021. Nucleic Acids Res. 49, D480–D489 (2021).

Artículo de Google Scholar

Salmón, D. et al. Un nuevo receptor de transferrina heterodimérico codificado por un par de genes asociados al sitio de expresión VSG en T. brucei. Celda 78, 75–86 (1994).

Artículo CAS PubMed Google Scholar

Higgins, MK y cols. Estructura del receptor de haptoglobina-hemoglobina del tripanosoma e implicaciones para la absorción de nutrientes y la inmunidad innata. Proc. Acad. Nacional. Ciencia. Estados Unidos 110, 1905-1910 (2013).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Varadi, M. y col. Base de datos de estructura de proteínas AlphaFold: ampliar masivamente la cobertura estructural del espacio de secuencia de proteínas con modelos de alta precisión. Ácidos nucleicos res. 50, D439–D444 (2022).

Artículo CAS PubMed Google Scholar

Saltador, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Steketee, PC y cols. El metabolismo divergente entre Trypanosoma congolense y Trypanosoma brucei da como resultado una sensibilidad diferencial a la inhibición metabólica. Patógeno PLoS. 17, e1009734 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Coustou, V., Guegan, F., Plazolles, N. y Baltz, T. Ciclo de vida completo in vitro de Trypanosoma congolense: desarrollo de herramientas genéticas. PLoS Negl. tropo. Dis. 4, e618 (2010).

Artículo PubMed PubMed Central Google Scholar

Nightingale, DJ, Lilley, KS y Oliver, SG Un protocolo para mapear el proteoma espacial utilizando HyperLOPIT en Saccharomyces cerevisiae. Bio-Protocolo 9, e3303 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Shin, J. y col. El repositorio común de proteínas fbs (cRFP) se agregará a una base de datos de búsqueda para el análisis espectrométrico de masas del secretoma celular. J. Proteoma Res. 18, 3800–3806 (2019).

Artículo CAS PubMed Google Scholar

Gatto, L. & Lilley, KS MSnbase: un paquete R/Bioconductor para visualización, procesamiento y cuantificación de datos de espectrometría de masas con etiquetas isobáricas. Bioinformática 28, 288–289 (2012).

Artículo CAS PubMed Google Scholar

Gatto, L., Gibb, S. & Rainer, J. MSnbase, procesamiento y visualización eficiente y elegante basado en R de datos de espectrometría de masas sin procesar. J. Proteoma Res. 20, 1063–1069 (2020).

Artículo PubMed Google Scholar

Wickham, H. y col. Bienvenido al Tidyverso. J. Software de código abierto. 4, 1686 (2019).

ADS del artículo Google Scholar

Wickham, H. ggplot2: Gráficos elegantes para análisis de datos (Springer-Verlag Nueva York, 2016).

Wu, T. y col. clusterProfiler 4.0: una herramienta de enriquecimiento universal para interpretar datos ómicos. Innovación 2, 100141 (2021).

CAS PubMed PubMed Central Google Académico

McInnes, L., Healy, J. y Astels, S. hdbscan: agrupación jerárquica basada en densidad. J. Software de código abierto. 2, 205 (2017).

ADS del artículo Google Scholar

Emms, DM y Kelly, S. OrthoFinder: resolver sesgos fundamentales en las comparaciones del genoma completo mejora drásticamente la precisión de la inferencia de ortogrupos. Genoma Biol. 16, 1-14 (2015).

Artículo CAS Google Scholar

Pérez-Riverol, Y. et al. Los recursos de la base de datos PRIDE en 2022: un centro para evidencias proteómicas basadas en espectrometría de masas. Ácidos nucleicos res. 50, D543–D552 (2022).

Artículo CAS PubMed Google Scholar

Gatto, L., Crook, OM & Breckels, LM pRolocdata: datos que acompañan al paquete pRoloc https://github.com/lgatto/pRolocdata (2022).

Descargar referencias

Este trabajo fue financiado por una beca BBSRC David Phillips (BB/P010849/1) para PM y una beca de investigación conjunta de Isaac Newton Trust, Wellcome Trust y la Universidad de Cambridge para PM; KB recibió el apoyo de un premio Wellcome Trust Investigator (214298/Z/18/Z) para RFW y una beca Leverhulme Early Career Fellowship (ECF-2015-562) para KB, que fue financiada conjuntamente por Leverhulme Trust e Isaac Newton Trust. ET agradece el apoyo de la Organización Científica Holandesa (VI.Veni.202.223). Agradecemos a: Mark Carrington (Universidad de Cambridge) por el suministro de anticuerpos y células, James Bangs (Universidad de Buffalo) por el suministro de anticuerpos, Catarina Gadelha (Universidad de Nottingham) por el suministro de células, Mike Deery (Centro de Proteómica de Cambridge) por realizando análisis de espectrometría de masas, y Yagnesh Umrania (Centro de Proteómica de Cambridge) por su ayuda con el análisis proteómico.

Departamento de Bioquímica, Universidad de Cambridge, Cambridge, CB2 1QW, Reino Unido

Nicola M. Moloney, Konstantin Barylyuk, Oliver M. Crook, Lisa M. Breckels, Kathryn S. Lilley, Ross F. Waller y Paula MacGregor

Bioquímica Celular, Instituto de Biotecnología y Ciencias Biomoleculares de Groningen, Universidad de Groningen, 9747 AG, Groningen, Países Bajos

Eelco Tromer

Departamento de Estadística, Universidad de Oxford, Oxford, OX1 3LB, Reino Unido

Oliver M. Crook

Facultad de Ciencias Biológicas, Universidad de Bristol, Bristol, BS8 1TQ, Reino Unido

Paula MacGregor

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

PM concibió el estudio, y NMM, KSL y RFW contribuyeron al diseño del estudio. NMM realizó y analizó los experimentos de hyperLOPIT, y KB contribuyó al diseño experimental. NMM y OMC realizaron el análisis TAGM. NMM realizó análisis computacional con KB, OMC y LMB contribuyendo al diseño e implementación del análisis. ET realizó el análisis de ortología y contribuyó al diseño y análisis de los resultados basados ​​en ortología. LMB construyó las aplicaciones Shiny. PM supervisó el proyecto y LMB, KSL y RFW contribuyeron a la tutoría y supervisión del proyecto. NMM y PM escribieron el manuscrito, que fue leído y aprobado por todos los autores.

Correspondencia a Paula MacGregor.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a los revisores anónimos por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Moloney, NM, Barylyuk, K., Tromer, E. et al. Mapeo de la diversidad en tripanosomas africanos utilizando proteómica espacial de alta resolución. Nat Comuna 14, 4401 (2023). https://doi.org/10.1038/s41467-023-40125-z

Descargar cita

Recibido: 29 de julio de 2022

Aceptado: 06 de julio de 2023

Publicado: 21 de julio de 2023

DOI: https://doi.org/10.1038/s41467-023-40125-z

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.