La identificación y el seguimiento de elementos móviles en las comunidades de compost en evolución arrojan información sobre el nanobioma
Comunicaciones ISME volumen 3, Número de artículo: 90 (2023) Citar este artículo
244 Accesos
8 altmétrico
Detalles de métricas
La evolución microbiana está impulsada por cambios rápidos en el contenido de genes mediados por la transferencia horizontal de genes (THG). Si bien los elementos genéticos móviles (MGEs) son importantes impulsores del flujo genético, el nanobioma (el zoológico de replicadores darwinianos que dependen de huéspedes microbianos) sigue estando mal caracterizado. Se necesitan nuevos enfoques para aumentar nuestra comprensión más allá de las MGE que dan forma a poblaciones individuales, hacia sus impactos en comunidades microbianas complejas. Se desarrolló un proceso bioinformático (xenoseq) para comparar muestras metagenómicas de consorcios microbianos que evolucionaban en paralelo, con el objetivo de identificar la diseminación de MGE, que se aplicó a comunidades de compost que se sometieron a mezclas periódicas de MGE. Mostramos que xenoseq puede distinguir el movimiento de MGE de los cambios demográficos en la composición de la comunidad que de otro modo confunden la identificación y, además, demostramos el descubrimiento de varias entidades inesperadas. De particular interés fue una nanobacteria del filo candidato radiación (CPR), que está estrechamente relacionado con una especie identificada en ecosistemas de aguas subterráneas (Candidatus Saccharibacterium) y parece tener un estilo de vida parásito. También destacamos otro elemento móvil prolífico, un plásmido de 313 kb alojado en un linaje Cellvibrio. Se predijo que el huésped sería capaz de fijar nitrógeno y la adquisición del plásmido coincide con una mayor producción de amoníaco. En conjunto, nuestros datos muestran que las nuevas estrategias experimentales combinadas con análisis bioinformáticos de datos metagenómicos pueden proporcionar información sobre el nanobioma como impulsor de la evolución de la comunidad microbiana.
La transferencia horizontal de genes (THG) puede afectar notablemente el destino evolutivo de los microbios [1,2,3]. Además de la transformación, donde las bacterias absorben directamente el ADN ambiental, todo movimiento horizontal de material genético es catalizado por elementos genéticos móviles (MGEs), entidades darwinianas con dinámica propia [4]. El siglo pasado, se ha observado una multiplicidad de MGE, que van desde los bacteriófagos claramente parásitos [5,6,7,8,9] y transposones [10,11,12], hasta plásmidos [13,14,15] y integrativos. y elementos conjugativos (ICE) [16,17,18,19]. Más recientemente, se están descubriendo nuevos elementos móviles en todo el mundo microbiano, como los REPIN [20, 21], Starships [22] y Borgs [23], e incluso cromosomas fúngicos enteros parecen estar en movimiento [24,25]. ,26].
La relación entre los MGE y los hosts es compleja, cambia constantemente y depende en gran medida del contexto. Por ejemplo, si bien los elementos conjugativos suelen ser benignos, también pueden promover la supervivencia a expensas de los huéspedes [19, 27]. De manera similar, si bien los bacteriófagos suelen ser depredadores o parásitos, pueden ser cooptados para beneficiar a los huéspedes [5, 28, 29, 30]. Además, los MGE pueden recombinarse entre sí o parasitar otros elementos móviles [31,32,33,34,35]. En conjunto, estos procesos pueden ser fundamentales para nuestra comprensión de las comunidades microbianas como colecciones de genes adaptativos localmente, en lugar de especies adaptadas localmente [36, 37]. Si bien actualmente no se comprende bien el alcance y la escala del flujo de ADN a través de las comunidades microbianas a través de MGE, trabajos recientes sugieren que el flujo puede ser muy significativo incluso en la medida en que define e impulsa un proceso a nivel comunitario con efectos similares al sexo dentro de las poblaciones. 38, 39].
Además de mover los genes necesarios para la autorreplicación y la transmisión, las MGE a menudo median en la transferencia de genes del huésped a los que se vinculan. Ya sea por diseño o por accidente, los MGE que adquieren genes que mejoran la aptitud del huésped pueden ser rápidamente amplificados por selección y los genes capturados se difunden ampliamente. En ocasiones, los efectos pueden tener grandes consecuencias; por ejemplo, el movimiento de los ICE que portan genes para la nodulación y la fijación de nitrógeno convierte los rizobios no simbióticos en plantas simbiontes en un solo paso [40, 41]. Los ICE también se han identificado mediante la observación del movimiento de la resistencia a los antimicrobianos [42, 43] y de los genes de resistencia a metales pesados [18]. Sin embargo, tales rutas hacia el descubrimiento dependen tanto de la capacidad de cultivar microbios focales como de la portación de rasgos fenotípicos seleccionables.
Con una capacidad cada vez mayor para secuenciar comunidades complejas, el descubrimiento de MGE ha sido impulsado por la metagenómica mediante el ensamblaje de replicones de ADN independiente del cultivo, sin suposiciones previas sobre la relevancia biológica. Además, se han desarrollado herramientas bioinformáticas que pueden separar una amplia gama de MGE candidatos de huéspedes microbianos [44,45,46,47,48,49,50,51]. Aunque dichas herramientas permiten la diferenciación del ADN cromosómico de fagos, plásmidos y otros MGE, el descubrimiento de MGE está limitado por las bases de datos existentes y los conjuntos de entrenamiento que se basan en MGE conocidos. Además, la detección metagenómica de MGE per se rara vez arroja luz sobre la relevancia ecológica del elemento. La detección y caracterización imparcial de MGE desconocidas sigue siendo un desafío importante.
Recientemente, Quistad et al. informaron una estrategia experimental de aplicación general que conecta el movimiento de genes a través de MGE con la ecología y el funcionamiento de comunidades microbianas complejas [52]. La estrategia aprovecha el hecho de que la persistencia a largo plazo de las MGE (y especialmente de aquellas que son costosas para los huéspedes) depende de la transmisión horizontal [53,54,55]. En ausencia de oportunidad de encontrar nuevos huéspedes, los MGE pierden capacidad replicativa, lo que resulta en extinción o cooptación como componentes permanentes del genoma del huésped, al menos en los casos en que los elementos codifican efectos de aptitud beneficiosos para el huésped. En cambio, la exposición frecuente a nuevos huéspedes puede dar "vida evolutiva" a los MGE, impulsando la coevolución continua de los MGE y sus huéspedes [13, 14, 56].
En el estudio de Quistad et al., se establecieron y mantuvieron comunidades de abono de jardín durante 48 semanas en mesocosmos de vidrio. Estas comunidades se dividieron además en dos pares: comunidades horizontales y verticales. Para las comunidades verticales (en adelante: comunidades V), una muestra de la comunidad (incluidas las MGE) se transfiere periódicamente a un mesocosmo nuevo. Las comunidades horizontales (en adelante: comunidades H) se tratan de manera similar, pero con una diferencia importante: en el momento de la transferencia, se pasa una muestra de todas las comunidades H independientes a través de un filtro de 0,2 µm y se recoge el filtrado. La filtración elimina bacterias y entidades más grandes, pero permite la recolección de material de menos de 0,2 µm que incluye MGE reconocidos, como fagos, pero también elementos aún por descubrir y, además, ADN desnudo, minerales, nutrientes, etc. Este filtrado se denomina "cóctel MGE". El cóctel MGE combinado de todas las comunidades independientes luego se redistribuye entre todas las comunidades H (ver Fig. 1a). Luego, las comunidades evolucionadas se sometieron a secuenciación metagenómica, que, en virtud del diseño experimental, permitió la identificación de secuencias en las comunidades H que no se detectaron en las respectivas comunidades ancestrales (en lo sucesivo denominadas "secuencias únicas"). Si bien su detección inicial no dependió de coincidencias con bases de datos virales existentes, se demostró que muchas de estas secuencias únicas codifican proteínas relacionadas con fagos. En principio, sin embargo, con este diseño experimental se podría detectar cualquier elemento del cóctel MGE que tuviera la capacidad de amplificarse después de su introducción en una nueva comunidad horizontal.
Descripción general de (a) configuración experimental, (b) fuentes de secuencias únicas y (c – e) el proceso bioinformático. un protocolo de evolución experimental para identificar nuevos MGE y otras secuencias móviles [52]. Se establecieron múltiples comunidades paralelas a partir de abono de jardín, que luego se propagaron sobre celulosa como única fuente de carbono y se transfirieron en serie cada dos semanas. Los tratamientos horizontales recibieron un 'cóctel MGE' que se obtuvo combinando material recolectado de muestras pasadas a través de filtros de 0,2 µm. Esta manipulación permite que los MGE y los genes vinculados se transfieran horizontalmente de una comunidad a la siguiente. b La secuenciación de muestras obtenidas de mesocosmos produce dos tipos de "secuencias únicas". Se muestran caricaturas para visualizar cómo algunas secuencias únicas (izquierda) son el resultado de secuencias raras que no fueron detectadas en muestreos anteriores, mientras que otras secuencias únicas (derecha) son el resultado de una transferencia genuina de otra comunidad. c La primera subrutina de xenoseq (xenoseq_find) compara secuencias de ADN sin procesar leídas en formato fastq de una muestra (consulta, en adelante llamada evolucionada) con otra muestra (sujeto, en adelante ancestral). Las muestras ancestrales se ensamblan en contigs, que se utilizan como cebo para eliminar lecturas de las muestras evolucionadas. Las lecturas no mapeadas de las muestras evolucionadas se ensamblan luego en "contigs únicos", tramos de ADN que han aparecido recientemente en la comunidad. d Para distinguir entre dos fuentes de secuencia única que se muestran en el panel b, la segunda subrutina (xenoseq_link) identifica elementos móviles candidatos alineándolos con todas las demás comunidades ancestrales. El subconjunto de cóntigos que se alinean con comunidades alopátricas se denominan cóntigos xenotípicos. e Finalmente, los patrones de diseminación de contigs xenotípicos se reconstruyen mapeando secuencias de ADN leídas de todas las comunidades frente a contigs ensamblados. La profundidad y amplitud de la secuencia se almacenan en un archivo de texto tabular.
Aquí, describimos un proceso 'xenoseq' de amplia aplicación (github.com/bramvandijk88/xenoseq) que toma como entrada lecturas de secuenciación sin procesar de experimentos de series temporales e identifica secuencias que han sido transferidas desde comunidades alopátricas y amplificadas mediante replicación en el sistema actual. comunidad. Cuando se aplica a los datos metagenómicos del experimento realizado por Quistad et al., mostramos que xenoseq detecta fácilmente MGE candidatos cuya dinámica (incluida la comunidad de origen) se puede seguir a través del tiempo. Un atributo importante de xenoseq es la capacidad de distinguir entre secuencias que se seleccionan debido a cambios demográficos en los patrones de abundancia de especies y aquellas que se diseminan horizontalmente desde una comunidad alopátrica. Estas últimas se denominarán en lo sucesivo "secuencias xenotípicas". Mostramos que las secuencias xenotípicas están enriquecidas en componentes reconocibles de fagos y elementos IS, es decir, elementos genéticos egoístas canónicos (SGE). Menos esperada fue la observación de nanobacterias transmitidas horizontalmente y grandes plásmidos. Para explorar la dinámica de los MGE a lo largo del estudio de un año de duración, se construyeron genomas ensamblados en metagenomas (MAG) mediante ensamblaje cruzado, lo que proporcionó información sobre los huéspedes potenciales de estos elementos inesperados y permitió vincular la difusión de los MGE a los cambios a nivel comunitario en las tasas de producción de amoníaco.
El proceso xenoseq (https://github.com/bramvandijk88/xenoseq, Fig. 1c-e) es un contenedor que combina recorte de lectura, ensamblaje, mapeo de lectura, filtrado de lectura y alineación local para buscar evidencia de transferencia horizontal de genes o la transferencia de otras entidades a nanoescala entre comunidades en evolución. Este canal toma como entrada archivos fastq sin procesar (sin recortar) que contienen datos metagenómicos de muestras derivadas (consulta, en la que buscar secuencias recién introducidas) y conjuntos de datos de muestras ancestrales (referencia). Las lecturas de consultas se recortan usando fastp [57] (v0.23.2), se asignan a los contigs de referencia correspondientes usando BWA [58, 59] (v0.7.17) usando las opciones predeterminadas, y samtools [60] (v1.15.1) se usa con la bandera '-4' para extraer lecturas no asignadas. Estas lecturas se ensamblan en 'contigs únicos' usando Megahit [61] (v1.2.9) (xenoseq_find, Fig. 1c). A continuación, estos contigs únicos se comparan con una base de datos local utilizando NCBI Blast [62] (v.2.13.0) de todas las demás comunidades de referencia para vincular el surgimiento de contigs únicos con las comunidades de "donantes" alopátricas. Los contigs vinculados se extraen de contigs únicos utilizando Seqkit [63] (v.2.3.0) (xenoseq_link, Fig. 1d). De forma predeterminada, los contigs están vinculados a un donante cuando el blasto tiene al menos un segmento de puntuación alta con una longitud mínima de 300 con al menos un 99 % de identidad de nucleótidos. Si bien el algoritmo y los límites limitan la sensibilidad en distancias evolutivas más grandes, están diseñados para detectar secuencias que han divergido recientemente y siguen siendo en gran medida idénticas. Los contigs que coinciden con secuencias objetivo en comunidades alopátricas se denominan "contigs xenotípicos". Finalmente, para detectar cambios en la abundancia de los contigs detectados, se asignan lecturas de todas las muestras de consulta y referencia (xenoseq_trace) y las estadísticas de cobertura/amplitud se guardan en un archivo separado por tabulaciones. Esto permite visualizar la transferencia entre comunidades (Fig. 1e). En este manuscrito, analizamos más a fondo secuencias> 10 kb de longitud.
De forma predeterminada, xenoseq ejecuta todas las subrutinas (xenoseq_find, xenoseq_link, xenoseq_trace), pero cada subrutina se puede ejecutar de forma independiente modificando los indicadores de la línea de comandos. Finalmente, xenoseq usa GNU paralelo59 para ejecutar múltiples trabajos simultáneamente.
Para comparar el proceso, se simuló la introducción de MGE en comunidades simuladas (consulte los detalles completos del Material complementario I). Se descargaron seis secuencias del genoma bacteriano de RefSeq. Luego se generaron dos comunidades simuladas, una con una distribución de taxones uniforme (conjunto de datos sencillo) y otra con una distribución de taxones muy sesgada (conjunto de datos duros). Las secuencias de MGE simuladas se i) insertaron aleatoriamente en secuencias del genoma, que representan elementos integrativos, o ii) se incluyeron como replicones separados vinculados a un único genoma del huésped mediante la adición al archivo fasta del genoma como un contig separado. La secuenciación de Illumina se simuló a partir de las "comunidades" resultantes con ART62, utilizando tasas de error predeterminadas y diez veces superiores, que se utilizaron como entrada para comparar el proceso. La simulación de comunidades simuladas y eventos de transferencia horizontal de genes se realizó en R v4.1.3 utilizando los paquetes biostrings60 v2.62.0 y seqinr61 v4.2.16. Otro (pequeño) conjunto de datos de comunidad simulada está disponible en el repositorio y se puede utilizar para probar rápidamente si la canalización y sus dependencias están configuradas correctamente.
Generamos MAG de las veinte comunidades de abono. Al combinar muestras en múltiples momentos, mejoramos la detección potencial de tipos raros cuya cobertura en una sola muestra es insuficiente para el ensamblaje. El control de calidad de las lecturas de secuenciación se realizó con Prinseq versión 0.20.4 [64] utilizando '–derep 14 -lc método -c umbral 20'. Recortamos los adaptadores con Flexbar v.3.5.0 [65] usando el indicador '–adapter-preset Nextera -ap ON'. Las lecturas combinadas de múltiples puntos temporales para cada comunidad se ensamblaron de novo utilizando metaSPAdes v.3.14.0 [66]. Las lecturas de cada muestra se asignaron a los contigs ensamblados utilizando bwa-mem v.0.7.17-r1188 [59], y los cálculos de cobertura se realizaron con SAMtools v1.7 [60]. Los contigs se agruparon utilizando metaBAT2 v2.12.1 [67] y la calidad MAG se evaluó con CheckM v1.1.3 [68]. Todos los MAG y contigs se anotaron utilizando BAT y CAT (Bin/Contig Annotation Tool, respectivamente, v.5.1.2) [69], que utiliza pródigo [70] para predecir marcos de lectura abiertos y diamante [71] para consultar marcos de lectura abiertos. contra la base de datos NR [72]. Cuando BAT o CAT no pudieron asignar de manera confiable un taxón debido a anotaciones conflictivas entre ORF, se asignó al MAG un rango taxonómico de orden superior: es decir, a nivel de género si no se podía asignar la identidad de especie, a nivel de familia si no se podía asignar el género. asignado, etc. Se llamó a CAT usando los parámetros '--index_chunk 1 --block_size 5 --top 11' usando la base de datos CAT y la taxonomía construida el 30 de abril de 2021. Se utilizó el mapeo de lectura de muestras de puntos de tiempo individuales (arriba) para estudiar la abundancia relativa de MAG individuales. La nanobacteria MAG se colocó en una filogenia 16S con MAG de ecosistemas de aguas subterráneas de He et al. [73] extrayendo secuencias 16S con Barnapp 0.9, y se creó un árbol de unión de vecinos con Geneious 2023.1.2.
Para investigar si las secuencias identificadas se derivan de células vivas o de ADN liberado por células lisadas, probamos la capacidad de las comunidades de abono microbiano para degradar el ADN extracelular. Para ello, se establecieron cuatro comunidades microbianas experimentales a partir de muestras de cuatro montones de abono independientes. El compost se lavó en una solución salina M9 y se almacenó con solución salina de glicerol a -80 °C. Las reservas congeladas se descongelaron en hielo y luego se lavaron 4,25 ml de la solución madre para eliminar el glicerol mediante dos ciclos sucesivos de centrifugación (4000 g, 10 min) y resuspensión (en 5 ml de solución salina M9 estéril), seguido de una resuspensión final en 1 ml. Solución salina M9. Luego, las células lavadas se agregaron a botellas de 100 ml con 19 ml de medio M9 y un trozo de papel de celulosa como fuente de carbono. Los mesocosmos se incubaron sin agitación a 28 °C durante 14 días para permitir el crecimiento de la comunidad. Luego se transfirió todo el volumen, incluido el papel restante, a tubos de centrífuga de 50 ml, se agitó durante cinco minutos para producir una suspensión y se transfirió 1 ml de suspensión a medio M9 nuevo durante otros 14 días de incubación. Durante este tiempo, se preparó una reserva de ADN genómico (ADNg) de Escherichia coli (REL606) utilizando el 'kit microbiano DNeasy Ultraclean' (Qiagen), lo que dio como resultado una reserva de ~30 ml de ADNg a 20 µg/ml (almacenado en - 20 ºC).
Luego, las comunidades se propagaron por segunda vez en cuatro mesocosmos de celulosa replicados enriquecidos con ADNg. También se establecieron mesocosmos libres de comunidad que actuaron como controles. A todos los mesocosmos se les agregaron diez µg de ADNg de E. coli y se recolectaron de manera destructiva después de 0, 1, 2 y 14 días de incubación. Para el muestreo, el contenido de cada mesocosmos se transfirió a un tubo de centrífuga de 20 ml, se redujo a una suspensión y luego se centrifugó a 4000 g durante 5 minutos. El sobrenadante se transfirió a tubos estériles de 15 ml y se congeló a -80 °C para su posterior extracción de ADN. En total, se recolectaron cuatro comunidades replicadas y tres controles libres de comunidad en cada momento.
Para medir la degradación relativa del ADN por parte de las comunidades a lo largo del tiempo, las muestras sobrenadantes se descongelaron en hielo y se les añadió un estándar interno de un µg/ml de ADNg de Pseudomonas fluorescens SBW25. Luego, las muestras se agitaron y se filtraron usando un filtro de jeringa de 0,2 µm. Se aisló el ADN de 2 ml de filtrado enriquecido utilizando un kit de aislamiento de ADN de fagos (Norgen Biotek Corp) siguiendo las instrucciones del fabricante, excepto por cargar dos (en lugar de uno) ml de muestra a través de una única columna de purificación para mejorar el rendimiento del ADN. Luego, el ADN extraído se secuenció utilizando un ciclo NextSeq MidOutput 300, lo que dio como resultado lecturas de extremos emparejados de 2 × 150 pb (consulte la Tabla complementaria I). Las lecturas se alinearon con la base de datos de proteínas no redundantes (NR) [72] con Diamond54 usando la subrutina blastx, donde el resultado superior se usó para identificar la lectura como P. fluorescens, E. coli u "otro" (el este último representa especies presentes en las comunidades o lecturas asignadas erróneamente).
Las secuencias virales se predijeron utilizando Vibrant (v1.2.0) [44], Virsorter2 (v2.2.3) [45], Seeker (v1.0.3) [46] y CheckV (v0.8.1) [74]. Si bien CheckV está diseñado principalmente para estimar la integridad de los genomas virales candidatos, descubrimos que otras herramientas también identificaron secuencias con puntuaciones bajas, medias o altas como virales (consulte la Fig. 3 en el texto principal). Las secuencias de plásmidos se predijeron utilizando PlasFlow (v1.1.0)w [47] y PlasClass (v0.1) [48] y, si corresponde, el origen de la replicación con OriFinder 2022 [75]. Los ICE se identificaron con ICEfinder [49]. Los elementos IS se predijeron con ISEscan (v1.7.2.3) [51]. Los integrones se predijeron utilizando Integronfinder2 (v2.0rc6) [50]. Todos los marcos de lectura abiertos en MGE se anotaron con prokka [76] tanto con la base de datos predeterminada como con la base de datos PHROG [77] para la identificación de genes virales. Todas las herramientas se ejecutaron con opciones predeterminadas; los resultados se muestran en la Tabla complementaria 1, Hoja 3.
Los recursos limitantes en el medio M9 del experimento de Quistad et al. son carbono (proporcionado por el papel de celulosa) y nitrógeno (cloruro de amonio 1 mM de sales M9), los cuales se agregan cada 14 días durante los pases en serie. Para obtener información sobre la función de la comunidad, se interrogó a los MAG sobre la presencia de genes que se predijo que estaban involucrados en la degradación de la celulosa y el metabolismo del nitrógeno. Aunque intervienen muchas proteínas relevantes, nos centramos en las endoglucanasas y celobiosidasas (degradación de la celulosa), nitrogenasas (fijación de nitrógeno) y nitrato/nitrito reductasa (reducción de nitrógeno). Para este estudio no se tienen en cuenta funciones más "privadas", como la capacidad de absorber glucosa, glucólisis y vías posteriores. Las secuencias de proteínas se extrajeron de la base de datos Uniprot (palabras clave: 'endoglucanasa', 'celobiosidasa', 'nitrato reductasa', 'nitrito reductasa' y 'nitrogenasa', todas con la consulta adicional 'revisado: verdadero') y se alinearon con MAG usando explosión de diamantex [71] con la configuración predeterminada. Se asignó una puntuación a cada MAG calculando la fracción de consultas coincidentes. Por ejemplo, cuando una de cada dos celobiosidasas de Uniprot dio una coincidencia significativa, se asignó una puntuación de 0,5. Todas las puntuaciones se dan en la Tabla complementaria 1, Hoja 5. Para la Fig. 5b, se asignó una función metabólica cuando la puntuación era superior a 0,1. Cuando se produjeron dos MAG con la misma anotación CAT en múltiples comunidades, pero las puntuaciones metabólicas no eran idénticas debido a diferencias en la cobertura genómica, se utilizó la puntuación más alta.
Para medir la concentración de ADN presente en los cócteles de ADN, se establecieron mesocosmos de compost utilizando el protocolo descrito en Quistad et al. Brevemente, se obtuvieron muestras de una pila de abono (Plön, Alemania) en septiembre de 2021. Se transfirieron cinco gramos de cada muestra de abono a un matraz de vidrio de 100 ml que contenía un trozo de papel de celulosa de cuatro cm2 como fuente de carbono complejo (papel de filtro de celulosa Whatman). ) en 20 ml de medio M9 mínimo que contiene cloruro de amonio 0,935 mM. Posteriormente, los mesocosmos fundadores se incubaron sin agitación a 28 °C durante 2 semanas. Las tapas permanecieron ligeramente abiertas, permitiendo el intercambio de gases.
Después de un período de incubación de 2 semanas, el papel de celulosa se transfirió a un tubo Falcon con 20 ml de medio M9 mínimo y se agitó en un vórtice hasta obtener una suspensión. Las suspensiones se agitaron y se centrifugaron 12 ml de suspensión de celulosa durante 10 minutos a 4000 g. Posteriormente, se filtraron 10 ml de sobrenadante a través de un filtro de 0,2 µm para producir el cóctel MGE. Para la extracción de ADN, los cócteles de MGE se concentraron utilizando una ultracentrífuga a ~26.500 g durante 45 minutos. Se descartó el sobrenadante y el sedimento se resuspendió en 2 ml de medio. El ADN se extrajo utilizando el kit Phage DNA Isolation (Norgen Biotek Corp) o el kit QIAprep Spin Miniprep, siguiendo el protocolo del fabricante. La cantidad de ADN extraído se evaluó mediante el ensayo Qubit HS. Las medidas se encuentran en la Tabla complementaria I, Hoja 4.
El análisis y visualización de datos se realizó en R [78] v4.1.3, utilizando los paquetes ggplot2 [79, p. 2], dplyr [80] v1.0.9, ggplotly [81] v3.4.1, patchwork [82] v1.1.1, gggenomes [83] v0.9.5.9000, ggraph (github.com/thomasp85/ggraph) v2.0.5 y rtracklayer [84] v1.60.0.
Se desarrolló un proceso bioinformático que identifica nuevas MGE y otras entidades biológicamente relevantes a partir de datos metagenómicos. El proceso no se basa en bases de datos existentes, sino que detecta la transferencia de MGE candidatos en función de secuencias recientemente introducidas en comunidades en evolución. Como tales secuencias son de naturaleza "extraña", nos referimos a ellas como "secuencias xenotípicas": la tubería se denomina xenoseq (https://github.com/bramvandijk88/xenoseq). Para obtener una descripción completa del proceso bioinformático, consulte los métodos y el material complementario I y II.
Xenoseq se comparó por primera vez utilizando comunidades simuladas simuladas (Materiales complementarios II) y luego se aplicó a conjuntos de datos de Quistad et al. Los datos de Quistad et al. Es de particular interés, porque el diseño experimental permite la diseminación de MGE dentro de comunidades horizontales, sin permitir la migración de células microbianas (Fig. 1a). Como se prepararon muestras de metagenoma de lectura corta de todas las comunidades en varios momentos, es posible identificar secuencias que no son nativas de las comunidades evolucionadas, es decir, candidatas para la transferencia de fagos, plásmidos u otros MGE. Sin embargo, no todas las secuencias que aparecen recientemente se deben a la transferencia horizontal del nanobioma entre comunidades alopátricas. Pueden surgir falsos positivos cuando una secuencia aumenta en abundancia dentro de las comunidades simpátricas, lo que puede suceder con especies raras que inicialmente están por debajo del límite de detección metagenómica (Fig. 1b). Esta señal falsa positiva debida al cambio demográfico debería aplicarse por igual a las comunidades horizontales y verticales. Por lo tanto, después de identificar 'secuencias únicas' recientemente emergidas (xenoseq_find, Fig. 1c), se busca más evidencia de transferencia alineando estos contigs con secuencias de comunidades alopátricas (xenoseq_link, Fig. 1d). Tenga en cuenta que aún pueden producirse falsos positivos cuando las comunidades paralelas son muy similares en composición; sin embargo, en el experimento de Quistad, las comunidades son diversas en composición (ver referencia [52]). Luego, como paso final, el mapeo de lectura proporciona más información sobre el origen y la diseminación de contigs xenotípicos (ver Fig. 1e).
Tenga en cuenta que, en principio, xenoseq se puede aplicar a conjuntos de datos que se desvían de este diseño experimental particular. Mientras que Quistad et al. Si utilizamos mesocosmos de vidrio, los ratones serían igualmente suficientes cuando uno esté interesado en la evolución de los microbiomas intestinales. El diseño experimental podría revelar las presiones de selección experimentadas por dichas comunidades naturales, donde el movimiento de los MGE (y los genes que llevan como carga) refleja qué rasgos son relevantes para la función comunitaria en esas condiciones. Además, se podría exponer a las comunidades en evolución a presiones de selección particulares, por ejemplo, para la resistencia a los antimicrobianos, para descubrir nuevos MGE que codifiquen rasgos relevantes bajo esa condición. El único requisito es que se tomen muestras longitudinales de comunidades paralelas que se someten a intercambio de MGE u otras entidades biológicamente relevantes.
Los mesocosmos del estudio de Quistad et al. representan un "caso desafiante" para el oleoducto xenoseq, debido a la diversidad y abundancia sin precedentes de tipos raros. Como se mencionó anteriormente, los cambios en la abundancia de tipos raros (como observaron Quistad et al.) pueden generar falsos positivos (Fig. 1b). Por lo tanto, como control, ejecutamos xenoseq en comunidades verticales, que están "cerradas" y no se ven afectadas por el movimiento de MGE de comunidades alopátricas. De hecho, encontramos que hay secuencias únicas presentes en comunidades tanto horizontales como verticales (Fig. 2a, un total de 5617 y 6883 secuencias respectivamente). Sin embargo, solo las comunidades horizontales contenían cóntigos únicos que podrían vincularse a comunidades alopátricas (Fig. 2b). En total, 1756 (31,2%) de los contigs en comunidades horizontales podrían vincularse a una comunidad de "donantes" alopátrica, frente a sólo 58 (0,8%) de los contigs de comunidades verticales. Los 58 contigs restantes pueden estar vinculados falsamente a comunidades alopátricas debido a la superposición entre comunidades ancestrales de compost. Si bien todas las comunidades de compost derivadas mostraron evidencia de secuencias de ADN que se amplificaron con el tiempo, se encontró evidencia de orígenes alopátricos de estas secuencias exclusivamente en comunidades horizontales.
a Contigs únicos dentro de comunidades horizontales (azul) y verticales (naranja) identificadas por xenoseq_find. Las líneas continuas representan la media en 10 comunidades, las áreas sombreadas representan el error estándar. b La alineación de los contigs identificados por xenoseq_find con muestras ancestrales permite vincular pares de donantes-aceptores (se muestra un ejemplo de red para comunidades horizontales y verticales en la semana 40; consulte también las figuras complementarias 1 y 2). Para las comunidades horizontales, los enlaces en la red representan elementos candidatos que se transfieren horizontalmente. Para las comunidades verticales, los vínculos representan falsos positivos, ya que el diseño experimental excluye la transferencia desde comunidades alopátricas. c El número de contigs xenotípicos (secuencias vinculadas a al menos una comunidad de donantes) identificados en comunidades horizontales se muestra en azul, y los falsos positivos observados en comunidades verticales se muestran en naranja. Los puntos representan 10 comunidades replicadas diferentes muestreadas en cada momento, las líneas sólidas representan la media de las comunidades cruzadas y el área sombreada representa el error estándar.
Un posible factor de confusión en la detección de secuencias xenotípicas surge si el ADN desnudo incluido en el cóctel MGE permaneciera intacto durante el período de incubación de 14 días y terminara así en los datos metagenómicos. Para probar esto, agregamos ADNg exógeno de Escherichia coli a las comunidades y monitoreamos su persistencia en el tiempo (ver Métodos). En presencia de comunidades microbianas, el ADNg de E. coli ya no fue detectable dentro de las 48 h posteriores a la adición (Figura complementaria 3), mientras que permaneció detectable durante el experimento de 14 días en controles sin comunidad. Además, con concentraciones de ADN de 0,67 ng/ml en los cócteles iniciales de MGE, consideramos muy poco probable que estas secuencias contribuyan significativamente a las muestras de metagenoma de la comunidad después de 14 días. En conjunto, estos datos demuestran que para que xenoseq prediga la transmisión horizontal, las secuencias de ADN primero deben persistir en la degradación y luego amplificarse lo suficiente dentro de la comunidad receptora. Tal amplificación indica alguna forma de selección para el MGE candidato, por ejemplo porque es un elemento egoísta o transmite un beneficio de aptitud física sustancial a un anfitrión.
El cóctel MGE que se distribuyó entre los mesocosmos podría contener bacteriófagos, plásmidos, ADN desnudo, vesículas de membrana y otros posibles vehículos de transferencia (desconocidos). Las 1756 secuencias xenotípicas se interrogaron utilizando una variedad de herramientas de detección de MGE, que proporcionaron predicciones sobre si las secuencias son virales [44,45,46, 74], plásmidos45,46, portadores de IS49, portadores de ICE47 o portadores de integrones48. . Encontramos que 714 (40,6%) de las secuencias xenotípicas fueron identificadas por al menos una herramienta de predicción de MGE (ver Fig. 3a). Se encontró una superposición considerable entre fagos y plásmidos (Fig. 3b), pero también entre otros elementos. Estos resultados indican la existencia de MGE recombinados o híbridos como fagos-plásmidos29. También pueden resaltar los desafíos de predecir sin ambigüedades el tipo de MGE a partir de la secuencia utilizando las herramientas seleccionadas.
a Se utilizaron varias herramientas para predecir MGE, incluidos fagos, plásmidos, elementos IS, ICE e integrones en secuencias xenotípicas. En el eje x hay 714/1756 contigs MGE candidatos con al menos una predicción de MGE. Las herramientas MGE se representan en el eje y. Las barras de colores indican que la herramienta correspondiente predijo el contig. b Un diagrama de Venn muestra una superposición sustancial entre MGE, especialmente fagos y plásmidos. Esto puede indicar interacciones o hibridación de fagos y plásmidos, pero también podría ser el resultado de una asignación errónea por parte de una de las herramientas. c El número de anotaciones MGE derivadas de secuencias xenotípicas se compara con cuatro controles. Los controles consisten en cóntigos con longitudes similares a los cóntigos xenotípicos, pero se toman muestras de todo el metagenoma de la comunidad de compost. Se utilizó una prueba T modificada (Crawford-Howell [110]) para inferir si los fagos, plásmidos, elementos IS, ICE o integrones estaban sobre o infrarrepresentados entre las secuencias xenotípicas (* = valor de p < 0,05, ** = valor de p < 0,01, *** = valor de p < 0,001). Consulte los valores p precisos, incluidos los corregidos para pruebas múltiples mediante un ajuste de Bonferroni, en la Tabla complementaria 1, hoja 3.
Para probar si las secuencias xenotípicas están enriquecidas en MGE, estos datos se compararon con un conjunto arbitrario de secuencias con una distribución de longitud similar, tomadas de los contigs metagenómicos. Tenga en cuenta que todavía se espera que estas muestras comunitarias contengan muchas MGE, pero quizás menos que las secuencias xenotípicas. De hecho, los fagos y los elementos IS parecen estar sobrerrepresentados entre las secuencias xenotípicas, mientras que el número de plásmidos, ICE e integrones no son significativamente diferentes (Fig. 3c). Cuando se corrigieron para pruebas múltiples, los fagos permanecieron significativamente sobrerrepresentados, pero esto no fue así para los elementos IS (consulte la Tabla complementaria I, Hoja 3 para todos los valores de p). En resumen, debido a que los elementos canónicamente egoístas parecen enriquecidos, los resultados pueden corroborar aún más la importancia de la amplificación de la secuencia después de la introducción en una nueva comunidad.
Curiosamente, después de aplicar nueve herramientas de última generación para predecir cinco categorías de MGE, 1.042 contigs xenotípicos (59,4%) permanecieron sin identificar.
Para investigar la difusión y la dinámica de los contigs xenotípicos, se utilizó xenoseq para asignar lecturas de todas las comunidades a los contigs xenotípicos que representan MGE candidatos. La Figura 4 muestra los resultados de siete ejemplos seleccionados: un fago completo de 200 kb (Fig. 4a), una secuencia de fagos incompleta pero abundante (Fig. 4b), una supuesta secuencia viral predicha exclusivamente por Seeker (Fig. 4c), un elemento predicho como fago y plásmido por unanimidad (Fig. 4d), un plásmido grande de 313 kb (Fig. 4e) y un tramo de ADN cromosómico aparente adyacente a un elemento IS3 (Fig. 4f).
Resultados de xenoseq_trace para siete secuencias xenotípicas; aa fago con cobertura de lectura del 100 % según lo informado por CheckV (abreviado como compl), b una secuencia de fago incompleta pero muy abundante (en ciertos puntos de tiempo cubierta por >106 lecturas), secuencia viral putativa predicha exclusivamente por el buscador, da secuencia reportada a ser tanto fago como plásmido mediante todas las herramientas MGE relevantes, un plásmido grande que se establece con éxito en cuatro comunidades, una supuesta región cromosómica flanqueada por un elemento transponible y una secuencia que no se predice que sea una MGE, pero que CAT está anotada como Candidatus Saccharibacterium. Para todos los paneles, las abundancias (ejes y, cobertura de lectura promedio) se muestran en las comunidades en todos los puntos temporales (ejes x). La abundancia en las comunidades horizontales se muestra en azul, mientras que la abundancia en las comunidades verticales se muestra en los ejes opuestos en naranja. Las comunidades cuya secuencia es exclusiva del régimen horizontal se muestran en negrita. Para mayor claridad, se omiten las comunidades en las que no se observó el contig. El conjunto de datos interactivo completo está disponible como material complementario.
Xenoseq también reveló la transferencia de fragmentos de ADN bacteriano cromosómico que carecen de predicciones de MGE, muchos de los cuales fueron anotados como Candidatus Saccharibacterium (Fig. 4g), un miembro de las bacterias candidatas al filo de radiación (CPR) observadas por primera vez en las cavidades orales humanas [85]. Aunque esta nanobacteria podría ser lo suficientemente pequeña como para pasar a través del filtro de 0,2 µm, los miembros de esta especie aparecen tanto en comunidades horizontales (comunidad 1, 3, 4, 5, 7, 8, 9 y 10) como en comunidades verticales ( comunidad 1, 3, 4, 7, 8, 9, 10), con estimaciones variables de finalización del genoma (consulte la Tabla complementaria 1). El MAG mejor representativo de esta especie se observó en HC10, que tiene un genoma pequeño (818 kb) que, sin embargo, se estimó que estaba completo en un 97% y, de hecho, codificaba muchos de los genes constitutivos relevantes (por ejemplo, gyrA, recA, polA, topA, rpoB y un único gen de ARN ribosómico 16S). La comparación de las secuencias 16S con las de bacterias CPR publicadas recientemente y arqueas DPANN de muestras de agua subterránea [73] muestra que se agrupa junto con otras bacterias CPR anotadas como Candidatus Saccharibacterium (consulte la figura complementaria 4). Curiosamente, las estimaciones sin alineación de la identidad promedio de nucleótidos (fastANI v1.33) revelaron que los MAG nanobacterianos (casi completos) de las comunidades son muy similares (hasta 99,4% ANI). Sin embargo, fastANI con respecto a las bacterias CPR de aguas subterráneas no arrojó resultados, lo que ocurre cuando los genomas comparados son demasiado diferentes. En conjunto, estos análisis sugieren que las nanobacterias en nuestros mesocosmos de compost están estrechamente relacionadas, pero son distintas, de estos MAG bacterianos publicados anteriormente.
El análisis de co-ocurrencia (ver Fig. 5a complementaria) revela además una conexión potencial entre la nanobacteria identificada y el género Cellvibrio. El seguimiento de la abundancia de ambos actores a lo largo del tiempo sugiere una posible dinámica de auge y caída, marcada por largos períodos de estasis (Figura complementaria 5b). Esta dinámica puede ser indicativa de un estilo de vida patógeno.
Hasta ahora, hemos ilustrado que el tratamiento de comunidades microbianas en evolución con un 'cóctel de MGE' derivado de todas las comunidades promueve el movimiento de varios MGE, e incluso nanobacterias, entre comunidades. También hemos demostrado que los cóntigs xenotípicos están especialmente enriquecidos en los SGE, lo que sugiere la importancia de la amplificación de secuencia independiente para la supervivencia de los MGE después de la introducción en comunidades alopátricas. En las siguientes secciones, examinamos las consecuencias ecológicas y evolutivas de este tratamiento. Para investigar si las comunidades horizontales se diferencian de las verticales y cómo, estudiamos la abundancia de MAG. A estos MAG se les asignó una clasificación taxonómica utilizando la herramienta Bin Annotation Tool (BAT). Cuando no se pudo determinar de manera confiable el rango taxonómico debido a ORF en conflicto, se asignó un rango taxonómico de orden superior, asegurando que todos los MAG tuvieran una clasificación sólida.
Cada MAG fue examinado en busca de varios genes relacionados con dos funciones metabólicamente relevantes: degradación de celulosa y metabolismo del nitrógeno (ver Métodos y Tabla complementaria I, Hoja 5). La abundancia relativa de MAG dominantes se muestra para cada comunidad en la Fig. 5a (para ver un gráfico interactivo de todos los MAG, consulte los Archivos complementarios). Los MAG están dominados por los linajes Rhodanobacter (que se muestran en marrón en la Fig. 5a) o Cellvibrio (que se muestran en verde). Los miembros de ambos géneros pueden degradar la celulosa, la única fuente de carbono en los mesocosmos (Fig. 5b). Como muchos otros MAG no tienen esta capacidad, Rhodanobacter y Cellvibrio parecen ocupar un nicho similar y son los principales degradadores de la celulosa, lo que podría explicar por qué parecen ser mutuamente excluyentes. Además, los dos tipos de comunidades tienen linajes distintos que cohabitan en los mesocosmos. Por ejemplo, las comunidades dominadas por los linajes de Rhodanobacter a menudo coexisten con Nitrosomonas europaeae (azul acero), que puede reducir el nitrato y el nitrito (Fig. 5b). En cambio, las comunidades dominadas por Cellvibrio albergan con frecuencia especies de C. Saccharibacteria mencionadas anteriormente (indicadas por un asterisco en la Fig. 5a, b.
a Para los 20 experimentos replicados (10 horizontales, 20 verticales), se muestra la abundancia (cobertura de lectura relativa) para los MAG a lo largo del tiempo. Para mayor claridad, solo se muestran los MAG que son muy abundantes en múltiples puntos temporales (que representan en promedio el 59,6 % de la comunidad total), y la abundancia se da como la fracción de lecturas que se asignan solo a estos MAG en particular. Un subconjunto de MAG está etiquetado con una letra (C1, R, N, Cp, etc.) correspondiente a la leyenda en (b). b Funciones metabólicas asignadas a cada MAG. A los MAG que codifican supuestas endoglucanasas, celobiosidasas, nitrogenasas (I y II) y nitrato/nitrito reductasa se les asignaron funciones de degradadores de celulosa, eliminadores de celulosa, fijadores de nitrógeno, reductores de nitrato y reductores de nitrito, respectivamente (ver Métodos). Se calculó una puntuación en función del número de aciertos significativos en estas secuencias de proteínas, y los MAG con una puntuación superior a 0,1 aparecen coloreados en el mapa de calor. c Un elemento móvil (Cp) circular de 313 kb que emerge en cuatro comunidades horizontales independientes. El elemento contiene rasgos tanto de plásmido como de fago.
Como se puede ver en la Fig. 5a, las comunidades verticales (VC, izquierda) son relativamente estables en la composición de MAG dominantes, estableciéndose con Cellvibrio o Rhodanobacter como degradadores primarios de celulosa. Sin embargo, las comunidades horizontales (HC) muestran cambios rápidos en estos degradadores primarios. Por ejemplo, el HC2 se establece inicialmente con Rhodanobacter (marrón) como principal degradador. Sin embargo, durante las semanas 4 a 8, un linaje de Cellvibrio (C1, verde) se vuelve más dominante en relación con otros MAG. Finalmente, Rhodanobacter resurge como el principal degradador. Viceversa, HC8 y HC9 se establecen inicialmente como comunidades Cellvibrio y muestran una apariencia transitoria de un linaje Rhodanobacter después de 32/40 semanas.
Si bien las interrupciones mencionadas anteriormente causadas por los cócteles MGE son transitorias, Cellvibrio C1 en HC6 parece alterar completamente la estructura del ecosistema que se estableció durante las 32 semanas anteriores, aunque no está claro si esta interrupción es transitoria ya que no tenemos mediciones posteriores. 48 semanas. Cellvibrio C1 también emerge en otros tres mesocosmos de forma independiente (en HC9 en la semana 8, y HC4 y HC10 en la semana 32), y su aparición siempre va acompañada de un MAG que contiene solo un contig de 313 kb (que se muestra en violeta en la Fig. 5a). en adelante denominado Cp). Este cóntig es de naturaleza circular y, de hecho, es el mismo elemento similar a un plásmido identificado anteriormente por xenoseq (Fig. 4e). El elemento móvil grande transporta proteínas de partición de plásmidos (por ejemplo, ParB y ParM) típicamente asociadas con plásmidos de bajo número de copias [86, 87] (ver Fig. 5c), lo que es consistente con su coexistencia con Cellvibrio C1 en aproximadamente 1: 1 proporción. Además de las características que son similares a los plásmidos grandes, Cp también porta muchos ORF asociados con fagos, como es evidente en las coincidencias con la base de datos viral PHROGs66 (por ejemplo, integrasa y endolisina). Finalmente, Cp lleva una supuesta región conjugativa identificada por ICEfinder. Como este plásmido está presente en momentos anteriores solo en VC/HC8, esto sugiere que esta comunidad es el donante. Nuestra hipótesis es que Cp se transfiere horizontalmente, lo que permite que Cellvibrio C1 (el huésped putativo) desplace la estructura del ecosistema previamente establecida.
Debido a que la celulosa es la única fuente de carbono proporcionada de forma exógena en los mesocosmos, no es sorprendente que muchos MAG tengan la capacidad de degradar la celulosa (ver Fig. 5b). Si bien todos los linajes de Cellvibrio tienen la capacidad de degradar la celulosa, un Cellvibrio en particular (C1) es único porque también porta una enzima fijadora de nitrógeno (flavoproteína, EC 1.19.6.1). La capacidad de fijar nitrógeno probablemente sea importante, porque 1 mM de cloruro de amonio del medio M9 agregado cada 14 días es la única fuente de nitrógeno suministrado exógenamente. Nuestra hipótesis es que el plásmido Cp puede tener impactos regulatorios en el metabolismo del huésped C1, quizás favoreciendo la fijación de nitrógeno.
En el estudio de Quistad et al., la producción de amoníaco se midió al final del experimento (T = 48 semanas). Al comparar la abundancia de Cellvibrio C1 con los datos sobre la producción de amoníaco, se observó una fuerte correlación positiva (Fig. 6a) en las comunidades horizontales, pero mucho menos en las comunidades verticales. Tenga en cuenta que C1 en la mayoría de las comunidades horizontales porta el plásmido Cp y C1 en las comunidades verticales no. Sugerimos que esto indica que C1 puede ser responsable de la acumulación de amoníaco, pero sólo en presencia del plásmido Cp. De hecho, al tomar la pendiente de la regresión lineal, encontramos que las comunidades horizontales muestran una correlación significativamente más pronunciada entre C1 y las tasas de producción de amoníaco, especialmente al principio del ciclo de crecimiento (Fig. 6b). Finalmente, al centrarse solo en las comunidades horizontales donde Cp estaba ausente (HC3 y HC7), no se observó correlación positiva (Figura 6 complementaria). Estos datos sugieren que Cp promueve la fijación de nitrógeno por Cellvibrio C1.
a La abundancia relativa de Cellvibrio C1 se determinó mediante la proporción de lecturas de la muestra en el mapeo de la semana 48 contra este MAG, que luego se representó gráficamente contra las mediciones de producción de amoníaco de Quistad et al [52]. Cellvibrio C1 estuvo presente en cinco comunidades verticales y siete comunidades horizontales, lo que produjo un total de 12 valores de abundancia para Cellvibrio C1, representados en el eje x. Para cada uno de estos valores, se realizaron tres mediciones técnicas replicadas de amoníaco en varios momentos del ciclo de 14 días. El eje y muestra las concentraciones de amoníaco medidas (NH3 + NH4). Se ajustó un modelo de regresión lineal a los puntos de datos. Para los días 0, 1 y 14, estos ajustes se muestran con sus correspondientes valores p y valores R2 (consulte la Figura complementaria 6 para todos los días). b La pendiente de la regresión lineal se representa para todos los días en el panel inferior, lo que revela que las comunidades horizontales muestran consistentemente una pendiente más pronunciada, lo que sugiere que el plásmido Cp grande promueve la fijación de nitrógeno por parte de Cellvibiro C1 MAG. Las barras de error indican la desviación estándar de la pendiente en tres réplicas técnicas de mediciones de producción de amoníaco. Los asteriscos indican diferencias significativas (prueba T de Student) entre las comunidades horizontal y vertical en ese momento (* = valor de p < 0,05, ** = valor de p < 0,01).
Los MGE son determinantes importantes de la evolución microbiana con efectos de gran alcance dentro del contexto de las comunidades. Por muy diversos que sean los microbiomas, el nanobioma (el conjunto de entidades darwinianas que dependen de huéspedes microbianos) probablemente sea aún más diverso. Desarrollamos un sistema bioinformático llamado xenoseq para arrojar luz sobre el nanobioma, inspirado en experimentos de Quistad et al. Utilizando datos metagenómicos resueltos en el tiempo, xenoseq puede distinguir entre dos fuentes de secuencias novedosas, (i) aquellas que surgen debido a cambios demográficos locales y (ii) aquellas que son consecuencia de la transmisión horizontal de entidades a nanoescala entre comunidades paralelas. Mostramos que la última categoría de secuencias xenotípicas requiere amplificación después de la introducción en comunidades alopátricas. Encontramos que las secuencias xenotípicas estaban especialmente enriquecidas en elementos genéticos egoístas (fagos y elementos IS). Si bien otros MGE, como los plásmidos y los ICE, no se enriquecieron, encontramos algunos jugadores inesperados que se transfirieron horizontalmente a través del filtrado, incluido un plásmido de 313 kb y una nanobacteria CPR. En conjunto, nuestros datos muestran que el oleoducto puede identificar con éxito una amplia gama de MGE interesantes, sin ningún conocimiento previo sobre su identidad.
La estrategia experimental de Quistad et al. y nuestro proceso bioinformático se puede aplicar a cualquier comunidad microbiana y puede adaptarse a presiones de selección específicas, como la resistencia a los antimicrobianos [88, 89], la resistencia a metales pesados [90] o la capacidad de biorremediación [91]. Además, incluso sin presiones de selección evidentes, el método puede proporcionar evidencia directa de las presiones de selección experimentadas por las comunidades, a través de la identificación de rasgos transferidos horizontalmente. Quistad et al. observaron el enriquecimiento de genes del metabolismo del nitrógeno en comunidades horizontales, que en este estudio hemos podido vincular con la proliferación de una gran secuencia similar a un plásmido de 313 kb. Dado su aparente papel indirecto en la fijación de nitrógeno, planteamos la hipótesis de que la amplificación de este elemento confiere una ventaja de aptitud física (Fig. 6). Se desconoce el mecanismo de transferencia horizontal, pero es poco probable que sea a través del ADN desnudo, lo que lleva a la posibilidad de que el elemento pueda estar empaquetado dentro de vesículas de membrana (MV) [92,93,94,95], como se demostró recientemente en Klebsiella pneumoniae [96 ].
Además del movimiento de MGE, nuestro estudio también sugiere que la competencia entre especies ecológicamente relevantes aumenta en las comunidades horizontales. Esta mayor competencia puede deberse a la dinámica de "matar al ganador" [97], mediante la cual los fagos reducen preferentemente la abundancia de especies microbianas establecidas, mientras que al mismo tiempo mejoran su propio destino evolutivo, dejando un nicho de espacio disponible para los competidores. Se observó una dinámica similar en un estudio reciente que ilustra cómo la inducción de profagos puede afectar significativamente el ensamblaje de comunidades que degradan la quitina [98]. En particular, estos cambios en la abundancia podrían exacerbar el problema de los falsos positivos, como observamos en este estudio. En conjunto, sostenemos que es importante mejorar la comprensión de cómo los MGE influyen en la competencia entre especies microbianas (por ejemplo, en sistemas socialmente relevantes como el intestino humano [99] o las rizosferas vegetales [100, 101]), lo que además puede permitirnos para hacer mejores predicciones evolutivas en el futuro [102].
Un hallazgo inesperado de nuestro estudio fue la aparente transmisión de una nanobacteria CPR del filo Saccharibacteria. De hecho, los parientes cercanos de este organismo no son mucho más grandes que un fago75, y el genoma reducido (~818 kb) es indicativo de una relación simbiótica con otra especie. Se demostró que la nanobacteria se agrupa estrechamente con las bacterias CPR observadas en los ecosistemas de aguas subterráneas [73], donde muchas células ultrapequeñas se adhieren a la superficie celular de bacterias más grandes. Se han observado patrones similares para Vampirococcus lugossi, que también se cree que son epibiontes que se adhieren a bacterias fotosintéticas [103]. Sin embargo, en lugar de episimbiontes, sugerimos que la nanobacteria en nuestro estudio puede ser un parásito intracelular, ya que la dinámica de auge y caída que se muestra marcada por largos períodos de estasis que se muestran en la figura complementaria 5b recuerda la dinámica depredadora observada para Bdellovibrio bacteriovorus. Nuestro análisis de co-ocurrencia (ver Fig. 5a complementaria) reveló una conexión potencial con un linaje bacteriano perteneciente al género Cellvibrio. La identificación de esta nanobacteria y la hipótesis recientemente generada sobre una relación huésped-parásito resaltan un poder adicional de nuestro enfoque. Curiosamente, muchas especies de Cellvibrio pueden aislarse y cultivarse, allanando el camino para futuros estudios sobre la nanobacteria y sus interacciones con el huésped.
Recientemente se han desarrollado varios métodos sin anotaciones para rastrear HGT en ecosistemas microbianos, basándose, por ejemplo, en la cobertura de lectura diferencial [104], gráficos de ensamblaje [105, 106], mapeo de pares de lectura discordantes [107] o metagenómica Hi-C. [88, 108, 109]. Sin embargo, en comparación con nuestro enfoque, estos métodos no proporcionan información sobre la dinámica y las consecuencias funcionales de la transmisión de MGE y cómo este flujo de ADN da forma a las comunidades microbianas. Nuestra estrategia combina intervención experimental, metagenómica y análisis bioinformático para descubrir elementos capaces de transmitirse en forma de nanopartículas y posterior amplificación, sin conocimiento previo de los elementos en sí. En otras palabras, utilizando nuestro método, es posible interrogar al nanobioma libre de nociones preconcebidas sobre la identidad de sus miembros.
Si bien ilustramos el descubrimiento de entidades biológicas novedosas e interesantes, también existe un potencial considerable para falsos positivos y falsos negativos. Como se aborda parcialmente en este estudio, los límites de detección metagenómica hacen que sea extremadamente difícil decir con certeza si una secuencia estaba presente ancestralmente en una comunidad o si se adquirió de una comunidad alopátrica. Además, es posible que tratar a las comunidades con cócteles de MGE tenga impactos indirectos en la composición de la comunidad, lo que, si resulta en que las especies raras se vuelvan más abundantes, exacerbaría aún más este problema. Si bien nuestro proyecto intenta reducir estos problemas vinculando secuencias con su comunidad de origen, esta estrategia se compensa con falsos negativos, ya que los eventos genuinos de transferencia horizontal de genes pueden descartarse erróneamente. Si bien sostenemos que avances como la metagenómica Hi-C pueden ayudar a aliviar algunas de estas dificultades, también sugerimos que estudios futuros apliquen el protocolo experimental a comunidades más simples (sintéticas), lo que facilitará la distinción del ADN extraño de secuencias raras. Sin embargo, tenga en cuenta que dicha simplificación tiene sus propias desventajas, ya que obstaculiza nuestra capacidad de estudiar los procesos que son inherentes a la complejidad misma [38]. Por lo tanto, sostenemos que para mejorar nuestra comprensión de los microbiomas complejos, también es importante aceptar la complejidad (con todas las fuentes potenciales de ruido que ello implica) e identificar las reglas simples que impulsan la dinámica ecoevolutiva de las comunidades microbianas.
Nuestro trabajo confirma conclusiones anteriores de que los ecosistemas microbianos están muy influenciados por el flujo de ADN creado por los MGE, incluso cuando estos flujos son inicialmente sutiles. Por lo tanto, sostenemos que comprender el nanobioma (el zoológico de entidades darwinianas mucho más pequeñas que las bacterias) es crucial para comprender la ecología microbiana y cómo estos sistemas eventualmente crecen hasta impactar ecosistemas enteros.
Los datos de secuenciación sin procesar se han tomado de Quistad et al. y están disponibles públicamente en línea (https://www.mg-rast.org/mgmain.html?mgpage=project&project=mgp18485). Los MAG, conjuntos de datos interactivos y scripts R para diseñar comunidades simuladas se publican en Zenodo (https://doi.org/10.5281/zenodo.7589193). Cualquier otra solicitud de datos puede enviarse a [email protected].
Kolstø AB. Organización dinámica del genoma bacteriano. Mol Microbiol. 1997;24:241–8. https://doi.org/10.1046/j.1365-2958.1997.3501715.x.
Artículo PubMed Google Scholar
Snel B, Bork P, Huynen MA. Genomas en proceso de cambio: la evolución del contenido de genes de arqueas y proteobacterias. Genoma Res. 2002;12:17–25. https://doi.org/10.1101/gr.176501.
Artículo CAS PubMed Google Scholar
Puigbò P, Lobkovsky AE, Kristensen DM, Wolf YI, Koonin EV. Genomas en confusión: cuantificación de la dinámica del genoma en supergenomas procariotas. BMC Biol. 2014;12:66 https://doi.org/10.1186/s12915-014-0066-4.
Artículo PubMed PubMed Central Google Scholar
Garoña A, Dagan T. La individualidad darwiniana de los elementos genéticos extracromosómicos exige retoques en la genética de poblaciones. Representante de Environ Microbiol. 2021;13:22–6. https://doi.org/10.1111/1758-2229.12894.
Artículo PubMed Google Scholar
Chen J, et al. Hipermovilidad del genoma por transducción lateral. Ciencia. 2018;362:207–12. https://doi.org/10.1126/science.aat5867.
Artículo CAS PubMed Google Scholar
Humphrey S, et al. La movilidad cromosómica bacteriana mediante transducción lateral supera la de los elementos genéticos móviles clásicos. Comuna Nacional. 2021;12:1. https://doi.org/10.1038/s41467-021-26004-5.
Dutilh BE, et al. Un bacteriófago muy abundante descubierto en secuencias desconocidas de metagenomas fecales humanos. Comuna Nacional. 2014;5:1. https://doi.org/10.1038/ncomms5498.
Garmaeva S, et al. Estabilidad del viroma intestinal humano y efecto de una dieta sin gluten. Representante celular 2021;35:109132.
Artículo CAS PubMed Google Scholar
de Jonge PA, et al. El perfil del viroma intestinal identifica una familia de bacteriófagos muy extendida asociada con el síndrome metabólico. Comuna Nacional. 2022;13:1. https://doi.org/10.1038/s41467-022-31390-5.
Siguier P, Filée J, Chandler M. Secuencias de inserción en genomas procarióticos. Opinión actual Microbiol. 2006;9:526–31. https://doi.org/10.1016/j.mib.2006.08.005.
Artículo CAS PubMed Google Scholar
Touchón M, Rocha EPC. Causas de la abundancia de secuencias de inserción en genomas procarióticos. Mol Biol Evol. 2007;24:969–81. https://doi.org/10.1093/molbev/msm014.
Artículo CAS PubMed Google Scholar
Wu Y, Aandahl RZ, Tanaka MM. Dinámica de las secuencias de inserción bacteriana: ¿pueden las ráfagas de transposición ayudar a que los elementos persistan? BMC Evol Biol. 2015;15:288 https://doi.org/10.1186/s12862-015-0560-5.
Artículo CAS PubMed PubMed Central Google Scholar
Hall JP, Wood AJ, Harrison E, Brockhurst MA. La dinámica de transferencia de plásmidos fuente-sumidero mantiene la movilidad genética en las comunidades bacterianas del suelo. Proc Natl Acad Sci. 2016;113:8260–5. https://doi.org/10.1073/pnas.1600974113.
Artículo CAS PubMed PubMed Central Google Scholar
Hülter NF, Wein T, Effe J, Garoña A y Dagan T. Las competiciones intracelulares revelan determinantes del éxito evolutivo de los plásmidos. Microbiol frontal. 2020:11. https://www.frontiersin.org/articles/10.3389/fmicb.2020.02062. Consultado el 18 de julio de 2022.
Garoña A, Hülter NF, Romero Picazo D, Dagan T. La deriva segregacional limita la tasa evolutiva de los plásmidos procarióticos. Mol Biol Evol. 2021;38:5610–24. https://doi.org/10.1093/molbev/msab283.
Artículo CAS PubMed PubMed Central Google Scholar
Burrus V. Mecanismos de estabilización de elementos integrativos y conjugativos. Opinión actual Microbiol. 2017;38:44–50. https://doi.org/10.1016/j.mib.2017.03.014.
Artículo CAS PubMed Google Scholar
Carraro N, Burrus V. La naturaleza dualista de los elementos integrativos y conjugativos. Mob Genet Elem. 2015;5:98–102. https://doi.org/10.1080/2159256X.2015.1102796.
Artículo CAS Google Scholar
Colombi E, Straub C, Künzel S, Templeton MD, McCann HC, Rainey PB. Evolución de la resistencia al cobre en el patógeno del kiwi Pseudomonas syringae pv. actinidiae mediante la adquisición de elementos conjugativos integrativos y plásmidos. Microbiol ambiental. 2017;19:819–32. https://doi.org/10.1111/1462-2920.13662.
Artículo CAS PubMed Google Scholar
Delavat F, Miyazaki R, Carraro N, Pradervand N, van der Meer JR. La vida oculta de los elementos integrativos y conjugativos. FEMS Microbiol Rev. 2017;41:512–37. https://doi.org/10.1093/femsre/fux008.
Artículo CAS PubMed PubMed Central Google Scholar
Bertels F, Rainey PB. Evolución dentro del genoma de REPIN: una nueva familia de ADN móvil en miniatura en bacterias. PLOS Genet. 2011;7:e1002132. https://doi.org/10.1371/journal.pgen.1002132.
Artículo CAS PubMed PubMed Central Google Scholar
Bertels F, Rainey PB. Antiguos replicadores darwinianos anidados dentro de genomas eubacterianos. Bioensayos. 2023;45:2200085. https://doi.org/10.1002/bies.202200085.
Gluck-Thaler E, et al. Los elementos de una nave espacial gigante movilizan genes accesorios en genomas de hongos. Mol. Biol. Evolución. 2022;39:msac109 https://doi.org/10.1093/molbev/msac109.
Artículo CAS PubMed PubMed Central Google Scholar
Al-Shayeb B, et al. Los Borg son elementos genéticos gigantes con potencial para expandir la capacidad metabólica. Naturaleza. 2022:610. https://doi.org/10.1038/s41586-022-05256-1.
Ma LJ, et al. La genómica comparada revela cromosomas móviles de patogenicidad en Fusarium. Naturaleza. 2010:464. https://doi.org/10.1038/nature08850.
Li J, Fokkens L, van Dam P, Rep M. Los cromosomas de patogenicidad móviles relacionados en Fusarium oxysporum determinan el rango de huéspedes en las cucurbitáceas. Mol. Patol de plantas. 2020;21:761–76. https://doi.org/10.1111/mpp.12927.
Artículo CAS PubMed PubMed Central Google Scholar
Li J, Fokkens L, Conneely LJ, Rep M. Los cromosomas de patogenicidad parcial en Fusarium oxysporum son suficientes para causar enfermedad y pueden transferirse horizontalmente. Microbiol ambiental. 2020;22:4985–5004. https://doi.org/10.1111/1462-2920.15095.
Artículo CAS PubMed PubMed Central Google Scholar
Jurėnas D, Fraikin N, Goormaghtigh F y Van Melderen L. Biología y evolución de los sistemas bacterianos de toxina-antitoxina, Nat Rev Microbiol. 2022:1–16. https://doi.org/10.1038/s41579-021-00661-1.
Lang AS, Zhaxybayeva O, Beatty JT. Agentes de transferencia de genes: elementos de intercambio genético similares a fagos. Nat Rev Microbiol. 2012;10:472–82. https://doi.org/10.1038/nrmicro2802.
Artículo CAS PubMed PubMed Central Google Scholar
Stanton tuberculosis. Agentes de transferencia de genes similares a profagos: nuevos mecanismos de intercambio de genes para especies de Methanococcus, Desulfovibrio, Brachyspira y Rhodobacter. Anaerobio. 2007;13:43–49. https://doi.org/10.1016/j.anaerobe.2007.03.004.
Artículo CAS PubMed Google Scholar
Rakonjac J, Bennett NJ, Spagnuolo J, Gagic D y Russel M. Bacteriófago filamentoso: biología, visualización de fagos y aplicaciones de nanotecnología. Problemas actuales Mol Biol. 2011;13. https://doi.org/10.21775/cimb.013.051.
Haskett TL, Ramsay JP, Bekuma AA, Sullivan JT, O'Hara GW, Terpolilli JJ. Persistencia evolutiva de elementos integrativos y conjugativos tripartitos. Plásmido. 2017;92:30–36. https://doi.org/10.1016/j.plasmid.2017.06.001.
Artículo CAS PubMed Google Scholar
Mark Osborn A, Böltner D. Cuando los fagos, los plásmidos y los transposones chocan: islas genómicas y transposones conjugativos y movilizables como un mosaico continuo. Plásmido. 2002;48:202–12. https://doi.org/10.1016/S0147-619X(02)00117-8.
Artículo CAS PubMed Google Scholar
Rocha E, Haudiquet M, de Sousa JM y Touchon M. Egoísta, promiscuo y a veces útil: cómo los elementos genéticos móviles impulsan la transferencia horizontal de genes en poblaciones microbianas. EcoEvoRxiv. 2021. https://doi.org/10.32942/osf.io/7t2jh.
Pfeifer E, Moura de Sousa JA, Touchon M, Rocha EPC. Las bacterias tienen numerosos grupos distintivos de fagos-plásmidos con fagos conservados y repertorios variables de genes de plásmidos. Ácidos nucleicos res. 2021;49:2655–73. https://doi.org/10.1093/nar/gkab064.
Artículo CAS PubMed PubMed Central Google Scholar
Pfeifer E, Bonnin RA, Rocha EP. Los plásmidos fagos propagan genes de resistencia a los antibióticos mediante infección y conversión lisogénica. MBio. 2022;13:e01851-22. https://doi.org/10.1128/mbio.01851-22.
Salón JPJ. ¿Es el cromosoma bacteriano un elemento genético móvil? Comuna Nacional. 2021;12:6400. https://doi.org/10.1038/s41467-021-26758-y.
Boucher Y, et al. Los acervos genéticos móviles locales cruzan rápidamente los límites de las especies para crear endemicidad dentro de las poblaciones globales de Vibrio cholerae. bio. 2011;2:e00335–10. https://doi.org/10.1128/mBio.00335-10.
Artículo CAS PubMed PubMed Central Google Scholar
Rainey PB, Quistad SD. Hacia una comprensión dinámica de las comunidades microbianas. Philos Trans R Soc B Biol Sci. 2020;375:20190248 https://doi.org/10.1098/rstb.2019.0248.
Artículo CAS Google Scholar
Pluma de tinta TRISTE. Regeneración adaptativa a través de escalas: replicadores e interactuantes desde ramas hasta bosques, Philos Theory Pract Biol. 2021;13. https://doi.org/10.3998/ptpbio.16039257.0013.001.
Sullivan JT, Patrick HN, Lowther WL, Scott DB, Ronson CW. Las cepas noduladoras de Rhizobium loti surgen mediante la transferencia simbiótica de genes cromosómicos en el medio ambiente. Proc Natl Acad Sci. 1995;92:8985–9. https://doi.org/10.1073/pnas.92.19.8985.
Artículo CAS PubMed PubMed Central Google Scholar
Sullivan JT, Ronson CW. Evolución de los rizobios mediante adquisición de una isla de simbiosis de 500 kb que se integra en un gen phe-tRNA. Proc Natl Acad. Ciencia. 1998;95:5145–9. https://doi.org/10.1073/pnas.95.9.5145.
Artículo CAS PubMed PubMed Central Google Scholar
Burrus V, Pavlovic G, Decaris B, Guédon G. Transposones conjugativos: la punta del iceberg. Mol. Microbiol. 2002;46:601–10. https://doi.org/10.1046/j.1365-2958.2002.03191.x.
Artículo CAS PubMed Google Scholar
Gawron-Burke C y Clewell DB. Un transposón de Streptococcus faecalis con propiedades de fertilidad. Naturaleza. 1982;300. https://doi.org/10.1038/300281a0.
Kieft K, Zhou Z, Anantharaman K. VIBRANT: recuperación automatizada, anotación y curación de virus microbianos y evaluación de la función de la comunidad viral a partir de secuencias genómicas. Microbioma. 2020;8:90 https://doi.org/10.1186/s40168-020-00867-0.
Artículo CAS PubMed PubMed Central Google Scholar
Guo J, et al. VirSorter2: un enfoque guiado por expertos y clasificador múltiple para detectar diversos virus de ADN y ARN. Microbioma. 2021;9:37 https://doi.org/10.1186/s40168-020-00990-y.
Artículo PubMed PubMed Central Google Scholar
Auslander N, Gussow AB, Benler S, Wolf YI, Koonin EV. Buscador: identificación sin alineación de genomas de bacteriófagos mediante aprendizaje profundo. Ácidos nucleicos res. 2020;48:e121 https://doi.org/10.1093/nar/gkaa856.
Artículo CAS PubMed PubMed Central Google Scholar
Krawczyk PS, Lipinski L, Dziembowski A. PlasFlow: predicción de secuencias de plásmidos en datos metagenómicos utilizando firmas genómicas. Ácidos nucleicos res. 2018;46:e35 https://doi.org/10.1093/nar/gkx1321.
Artículo CAS PubMed PubMed Central Google Scholar
Pellow D, Mizrahi I, Shamir R. PlasClass mejora la clasificación de la secuencia de plásmidos. Computación más. Biol. 2020;16:e1007781 https://doi.org/10.1371/journal.pcbi.1007781.
Artículo CAS PubMed PubMed Central Google Scholar
Liu M, et al. ICEberg 2.0: una base de datos actualizada de elementos integrativos y conjugativos bacterianos. Ácidos nucleicos res. 2019;47:D660–D665. https://doi.org/10.1093/nar/gky1123.
Artículo CAS PubMed Google Scholar
Néron B, Littner E, Haudiquet M, Perrin A, Cury J y EPC Rocha EPC. IntegronFinder 2.0: identificación y análisis de integrones en bacterias, centrándose en la resistencia a los antibióticos en Klebsiella. Microorganismos. 2022;10. https://doi.org/10.3390/microorganisms10040700.
Xie Z, Tang H. ISEScan: identificación automatizada de elementos de secuencia de inserción en genomas procarióticos. Bioinformática. 2017;33:3340–7. https://doi.org/10.1093/bioinformatics/btx433.
Artículo CAS PubMed Google Scholar
Quistad SD, Doulcier G, Rainey PB. La manipulación experimental de elementos genéticos egoístas vincula los genes con la función de la comunidad microbiana. Philos Trans R Soc B Biol Sci. 2020;375:20190681 https://doi.org/10.1098/rstb.2019.0681.
Artículo CAS Google Scholar
Doolittle WF y Sapienza C. Genes egoístas, el paradigma del fenotipo y la evolución del genoma. Naturaleza. 1980:284. https://doi.org/10.1038/284601a0.
Baltrus DA. Explorando los costos de la transferencia horizontal de genes. Tendencias Ecol Evol. 2013;28:489–95. https://doi.org/10.1016/j.tree.2013.04.002.
Artículo PubMed Google Scholar
van Dijk B, Hogeweg P, Doekes HM, Takeuchi N. Las bacterias que evolucionan la captación de ADN retienen genes ligeramente beneficiosos a pesar de los elementos egoístas. eVida. 2020;9:e56801 https://doi.org/10.7554/eLife.56801.
Artículo PubMed PubMed Central Google Scholar
van Dijk B, Bertels F, Stolk L, Takeuchi N, Rainey PB. Los elementos transponibles promueven la evolución de la racionalización del genoma. Philos Trans R Soc B Biol Sci. 2022;377:20200477 https://doi.org/10.1098/rstb.2020.0477.
Artículo CAS Google Scholar
Chen S, Zhou Y, Chen Y, Gu J. fastp: un preprocesador FASTQ todo en uno ultrarrápido. Bioinformática. 2018;34:i884–i890. https://doi.org/10.1093/bioinformatics/bty560.
Artículo CAS PubMed PubMed Central Google Scholar
Li H, Durbin R. Alineación de lectura larga rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática. 2010;26:589–95. https://doi.org/10.1093/bioinformatics/btp698.
Artículo CAS PubMed PubMed Central Google Scholar
Vasimuddin M, Misra S, Li H y Aluru S. Aceleración eficiente basada en la arquitectura de BWA-MEM para sistemas multinúcleo, en: Actas del simposio internacional de procesamiento distribuido y paralelo de IEEE (IPDPS), 2019, p. 314–24. https://doi.org/10.1109/IPDPS.2019.00041.
Li H, et al. El formato de alineación/mapa de secuencia y SAMtools. Bioinformática. 2009;25:2078–9. https://doi.org/10.1093/bioinformatics/btp352.
Artículo CAS PubMed PubMed Central Google Scholar
Li D, Liu CM, Luo R, Sadakane K, Lam TW. MEGAHIT: una solución ultrarrápida de un solo nodo para el ensamblaje metagenómico grande y complejo mediante un gráfico sucinto de Bruijn. Bioinformática. 2015;31:1674–6. https://doi.org/10.1093/bioinformatics/btv033.
Artículo CAS PubMed Google Scholar
Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Herramienta básica de búsqueda de alineación local. J Mol Biol. 1990;215:403–10. https://doi.org/10.1016/S0022-2836(05)80360-2.
Artículo CAS PubMed Google Scholar
Shen W, Le S, Li Y, Hu F. SeqKit: un conjunto de herramientas ultrarrápido y multiplataforma para la manipulación de archivos FASTA/Q. Más uno. 2016;11:e0163962 https://doi.org/10.1371/journal.pone.0163962.
Artículo CAS PubMed PubMed Central Google Scholar
Schmieder R, Edwards R. Control de calidad y preprocesamiento de conjuntos de datos metagenómicos. Bioinformática. 2011;27:863–4. https://doi.org/10.1093/bioinformatics/btr026.
Artículo CAS PubMed PubMed Central Google Scholar
Dodt M, Roehr JT, Ahmed R, Dieterich C. FLEXBAR: procesamiento de adaptadores y códigos de barras flexibles para plataformas de secuenciación de próxima generación. Biología. 2012;1. https://doi.org/10.3390/biology1030895.
Nurk S, Meleshko D, Korobeynikov A, Pevzner PA. metaSPAdes: un nuevo ensamblador metagenómico versátil. Genoma Res. 2017;27:824–34. https://doi.org/10.1101/gr.213959.116.
Artículo CAS PubMed PubMed Central Google Scholar
Kang DD, et al. MetaBAT 2: un algoritmo de agrupamiento adaptativo para una reconstrucción genómica sólida y eficiente a partir de ensamblajes de metagenomas. PeerJ. 2019;7:e7359 https://doi.org/10.7717/peerj.7359.
Artículo PubMed PubMed Central Google Scholar
Parks DH, Imelfort M, Sknnerton CT, Hugenholtz P, Tyson GW. CheckM: evaluación de la calidad de los genomas microbianos recuperados de aislados, células individuales y metagenomas. Genoma Res. 2015;25:1043–55. https://doi.org/10.1101/gr.186072.114.
Artículo CAS PubMed PubMed Central Google Scholar
von Meijenfeldt FAB, Arkhipova K, Cambuy DD, Coutinho FH, Dutilh BE. Clasificación taxonómica sólida de secuencias y contenedores microbianos desconocidos con CAT y BAT. Genoma Biol. 2019;20:217 https://doi.org/10.1186/s13059-019-1817-x.
Artículo CAS Google Scholar
Hyatt D, Chen GL, LoCascio PF, Land ML, Larimer FW, Hauser LJ. Pródigo: reconocimiento de genes procarióticos e identificación del sitio de inicio de la traducción. Bioinformación de BMC. 2010;11:119 https://doi.org/10.1186/1471-2105-11-119.
Artículo CAS Google Scholar
Buchfink B, Xie C, Huson DH. Alineamiento de proteínas rápido y sensible usando DIAMOND. Nat. Métodos. 2015;12:59–60. https://doi.org/10.1038/nmeth.3176.
Artículo CAS PubMed Google Scholar
Sayers EW, et al. GenBank. Ácidos nucleicos res. 2022;50:D161–D164. https://doi.org/10.1093/nar/gkab1135.
Artículo CAS PubMed Google Scholar
Él C, et al. La metagenómica resuelta por el genoma revela diversidad específica de sitio de bacterias CPR episimbióticas y arqueas DPANN en ecosistemas de aguas subterráneas. Microbiol natural. 2021;6. https://doi.org/10.1038/s41564-020-00840-5.
Nayfach S, Camargo AP, Schulz F, Eloe-Fadrosh E, Roux S y Kyrpides NC. CheckV evalúa la calidad y la integridad de los genomas virales ensamblados en metagenomas. Nat Biotecnología. 2021;39. https://doi.org/10.1038/s41587-020-00774-7.
Dong MJ, Luo H, Gao F. Ori-Finder 2022: un servidor web completo para la predicción y análisis de los orígenes de la replicación bacteriana. Genómica, Proteómica y Bioinformática. 2022;20:1207–13. https://doi.org/10.1016/j.gpb.2022.10.002.
Seemann T. Prokka: anotación rápida del genoma procariótico. Bioinformática. 2014;30:2068–9. https://doi.org/10.1093/bioinformatics/btu153.
Artículo CAS PubMed Google Scholar
Terzian P, et al. PHROG: familias de proteínas de virus procarióticos agrupadas mediante homología remota. Bioinformación del genoma NAR. 2021;3:lqab067 https://doi.org/10.1093/nargab/lqab067.
Artículo CAS PubMed PubMed Central Google Scholar
R Core Team, R: un lenguaje y entorno para la informática estadística. https://www.R-project.org/.
Wickham H. ggplot2: Gráficos elegantes para análisis de datos. Springer-Verlag Nueva York, 2016. [En línea]. https://ggplot2.tidyverse.org.
Wickham H, François R, Henry L, Müller K y Studio R. dplyr: una gramática de la manipulación de datos. 2015. Disponible: https://CRAN.R-project.org/package=dplyr. Consultado el 16 de junio de 2020.
Visualización interactiva de datos basada en web con R, plotly y shiny (Carson Sievert) - Li - 2021 - Biometría - Wiley Online Library. https://onlinelibrary.wiley.com/doi/10.1111/biom.13474. Consultado el 11 de agosto de 2022.
El compositor de tramas. https://patchwork.data-imaginist.com/. Consultado el 11 de agosto de 2022.
Hackl T. gggenomas. 8 de agosto de 2022. Disponible: https://github.com/thackl/gggenomes. Consultado el 11 de agosto de 2022.
Lawrence M, Gentleman R, Carey V. rtracklayer: un paquete R para interactuar con navegadores de genoma. Bioinformación. 2009;25:1841–2. https://doi.org/10.1093/bioinformatics/btp328.
Artículo CAS Google Scholar
Él X, et al. El cultivo de un filotipo TM7 asociado a humanos revela un genoma reducido y un estilo de vida parásito epibiótico. Proc Natl Acad Sci Estados Unidos. 2015;112:244–9. https://doi.org/10.1073/pnas.1419038112.
Artículo CAS PubMed Google Scholar
Pinto UM, Pappas KM y Winans SC. El ABC de la replicación y segregación de plásmidos. Nat Rev Microbiol. 2012;10. https://doi.org/10.1038/nrmicro2882.
Møller-Jensen J, Borch J, Dam M, Jensen RB, Roepstorff P, Gerdes K. Mitosis bacteriana: ParM del plásmido R1 mueve el ADN del plásmido mediante un mecanismo de polimerización por inserción similar a la actina. Celda Mol. 2003;12:1477–87. https://doi.org/10.1016/s1097-2765(03)00451-9.
Artículo PubMed Google Scholar
Beyi AF, Hassall A, Phillips GJ y Plummer PJ. Seguimiento de reservorios de genes de resistencia a los antimicrobianos en una comunidad microbiana compleja utilizando Hi-C metagenómico: el caso de la dermatitis digital bovina. Antibióticos. 2021;10. https://doi.org/10.3390/antibiotics10020221.
Geyrhofer L, Ruelens P, Farr AD, Pesce D, de Visser JAGM y Brenner N. La carrera hacia la supervivencia durante la descomposición de los antibióticos determina el tamaño mínimo de la población sobreviviente. bioRxiv. 2022. https://doi.org/10.1101/2022.08.04.502802.
Hesse E, et al. Selección ecológica de taxones microbianos productores de sideróforos en respuesta a la contaminación por metales pesados. Ecología Lett. 2018;21:117–27. https://doi.org/10.1111/ele.12878.
Artículo PubMed Google Scholar
Shibasaki S, Mitri S. Control de la dinámica evolutiva para optimizar la biorremediación microbiana. Aplicación Evol. 2020;13:2460–71. https://doi.org/10.1111/eva.13050.
Artículo PubMed PubMed Central Google Scholar
Soler N, Krupovic M, Marguet E, Forterre P. Vesículas de membrana en ambientes naturales: un gran desafío en la ecología viral. ISME J. 2015;9:793–6. https://doi.org/10.1038/ismej.2014.184.
Artículo CAS PubMed Google Scholar
Tashiro Y, et al. Interacción de vesículas de membrana bacteriana con especies específicas y su potencial para llegar a las células diana. Microbiol frontal. 2017;8:571 https://doi.org/10.3389/fmicb.2017.00571.
Artículo PubMed PubMed Central Google Scholar
Biller SJ, Schubotz F, Roggensack SE, Thompson AW, Summons RE, Chisholm SW. Vesículas bacterianas en ecosistemas marinos. Ciencia. 2014;343:183–6. https://doi.org/10.1126/science.1243457.
Artículo CAS PubMed Google Scholar
Marcilla A & Sánchez-López CM. Vesículas extracelulares como mecanismo de transferencia horizontal de genes en Leishmania. Tendencias Parasitol. 2022;S1471492222001817. https://doi.org/10.1016/j.pt.2022.08.004.
Altamia MA, et al. Teredinibacter hydensis sp. nov., Teredinibacter purpureus sp. nov. y Teredinibacter franchisae sp. nov., bacterias endosimbióticas celulolíticas marinas aisladas de las branquias del molusco perforador de la madera Bankia setacea (Bivalvia: Teredinidae) y descripción modificada del género Teredinibacter. Int J Sistema Evol. Microbiol. 2021;71:004627 https://doi.org/10.1099/ijsem.0.004627.
Artículo CAS PubMed PubMed Central Google Scholar
Koskella B, Brockhurst MA. La coevolución bacteria-fago como impulsora de procesos ecológicos y evolutivos en comunidades microbianas. FEMS Microbiol Rev. 2014;38:916–31. https://doi.org/10.1111/1574-6976.12072.
Artículo CAS PubMed Google Scholar
Szabo RE, et al. Las contingencias históricas y la inducción de fagos diversifican las comunidades de bacterioplancton a microescala. Proc Natl Acad Sci. 2022;119:e2117748119 https://doi.org/10.1073/pnas.2117748119.
Artículo CAS PubMed PubMed Central Google Scholar
Reyes A, Semenkovich NP, Whiteson K, Rohwer F y Gordon JI. Volviéndose viral: secuenciación de próxima generación aplicada a poblaciones de fagos en el intestino humano. Nat Rev Microbiol. 2012;10. https://doi.org/10.1038/nrmicro2853.
Wang X, et al. Terapias combinadas de fagos para la enfermedad de marchitez bacteriana en tomate. Nat. Biotecnología. 2019;37. https://doi.org/10.1038/s41587-019-0328-3.
Wang X, et al. Los parásitos y los competidores suprimen los patógenos bacterianos de forma sinérgica debido a compensaciones evolutivas. Evolución. 2017;71:733–46. https://doi.org/10.1111/evo.13143.
Artículo PubMed Google Scholar
Wortel MT, et al. Hacia predicciones evolutivas: promesas y desafíos actuales. Aplicación Evol. 2023;16:3–21. https://doi.org/10.1111/eva.13513.
Artículo PubMed Google Scholar
Moreira D, Zivanovic Y, López-Archilla AL, Iniesto M y López-García P. Evolución reductiva y modo depredador único en la bacteria CPR Vampirococcus lugosii. Comuna Nacional. 2021;1 https://doi.org/10.1038/s41467-021-22762-4
Durrant MG, Li MM, Siranosian BA, Montgomery SB, Bhatt AS. Un análisis bioinformático de elementos genéticos móviles integrativos destaca su papel en la adaptación bacteriana. Microbio huésped celular. 2020;27:140–153.e9. https://doi.org/10.1016/j.chom.2019.10.022.
Artículo CAS PubMed Google Scholar
Antipov D, Raiko M, Lapidus A, Pevzner PA. MetaviralSPAdes: ensamblaje de virus a partir de datos metagenómicos. Bioinformática. 2020;36:4126–9. https://doi.org/10.1093/bioinformatics/btaa490.
Artículo CAS PubMed Google Scholar
Brown CT, Moritz D, O'Brien MP, Reidl F, Reiter T, Sullivan BD. La exploración de vecindarios en grandes gráficos de ensamblaje de metagenomas utilizando spacegraphcats revela diversidad de secuencias ocultas. Genoma Biol. 2020;21:164 https://doi.org/10.1186/s13059-020-02066-4.
Artículo PubMed PubMed Central Google Scholar
Bae J, Lee KW, Islam MN, Yim HS, Park H, Rho M. iMGEins: detección de nuevos elementos genéticos móviles insertados en genomas individuales. Genoma de BMC. 2018;19:944 https://doi.org/10.1186/s12864-018-5290-9.
Artículo CAS Google Scholar
Yaffe E, Relman DA. El seguimiento de la evolución microbiana en el intestino humano utilizando Hi-C revela una amplia transferencia, persistencia y adaptación horizontal de genes. Microbiol natural. 2020;5:343–53. https://doi.org/10.1038/s41564-019-0625-0.
Artículo CAS PubMed Google Scholar
Kent AG, Vill AC, Shi Q, Satlin MJ y Brito IL. La transferencia generalizada de genes móviles de resistencia a los antibióticos dentro de los microbiomas intestinales individuales se revela a través de la Hi-C bacteriana. Comuna Nacional. 2020;11. https://doi.org/10.1038/s41467-020-18164-7.
Crawford JR, Howell DC. Comparar la puntuación de una prueba individual con normas derivadas de muestras pequeñas. Clínico. Neuropsicología. 1998;12:482–6. https://doi.org/10.1076/clin.12.4.482.7241.
Artículo de Google Scholar
Descargar referencias
Agradecemos a Eitan Yaffe por las fructíferas discusiones durante el desarrollo del oleoducto. También agradecemos a David Rogers por su ayuda con los métodos estadísticos, por dilucidar fuentes potenciales de artefactos de secuenciación que podrían alterar nuestro análisis y, en general, por sus debates muy esclarecedores.
BvD, AF, PB y PBR agradecen el apoyo del Centro de Investigación Colaborativa Deutsche Forschungsgemeinschaft (DFG) 1182 'Origen y función de los metaorganismos' (subvención n.º SFB1182, proyecto C4 para PBR). PBR reconoce la generosa financiación básica de la Sociedad Max-Planck. BED recibió el apoyo de la subvención Consolidator 865694 del Consejo Europeo de Investigación (ERC): DiversiPHI, la Deutsche Forschungsgemeinschaft (DFG, Fundación Alemana de Investigación) bajo la Estrategia de Excelencia de Alemania – EXC 2051—Proyecto-ID 390713860, y la Fundación Alexander von Humboldt en el contexto de una cátedra Alexander von Humboldt financiada por el Ministerio Federal de Educación e Investigación de Alemania. Financiamiento de Acceso Abierto habilitado y organizado por Projekt DEAL.
Departamento de Biología de Poblaciones Microbianas, Instituto Max Planck de Biología Evolutiva, Plön, Alemania
Bram van Dijk, Pauline Buffard, Andrew D. Farr, Franz Giersdorf y Paul B. Rainey
Biología Teórica y Bioinformática, Departamento de Biología, Ciencia para la Vida, Universidad de Utrecht, Utrecht, Países Bajos
Bram van Dijk, Jeroen Meijer y Bas E. Dutilh
Instituto de Biodiversidad, Facultad de Ciencias Biológicas, Grupo de Excelencia Balance of the Microverse, Universidad Friedrich Schiller, Jena, Alemania
Bas E. Dutilh
Laboratorio de Biofísica y Evolución, CBI, ESPCI París, Université PSL CNRS, París, Francia
Paul B. Rainey
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
También puedes buscar este autor en PubMed Google Scholar.
BvD diseñó y probó el proceso, seleccionó, analizó y visualizó los datos metagenómicos, escribió el borrador original y fue responsable de la revisión y edición durante las revisiones. PB probó y comparó el proceso durante todo el desarrollo. ADF y FG realizaron experimentos adicionales para probar la estabilidad del ADN en los mesocosmos de compost. JM y BED realizaron un ensamblaje cruzado de MAG. PB contribuyó con ideas y conceptos y participó en la elaboración del manuscrito final. Todos los autores leyeron el manuscrito final, dieron su aprobación para su publicación y aceptan ser responsables del trabajo.
Correspondencia a Bram van Dijk o Paul B. Rainey.
Los autores declaran no tener conflictos de intereses.
Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
van Dijk, B., Buffard, P., Farr, AD et al. La identificación y el seguimiento de elementos móviles en las comunidades de compost en evolución arroja información sobre el nanobioma. COMUN ISME. 3, 90 (2023). https://doi.org/10.1038/s43705-023-00294-w
Descargar cita
Recibido: 17 de febrero de 2023
Revisado: 02 de agosto de 2023
Aceptado: 08 de agosto de 2023
Publicado: 28 de agosto de 2023
DOI: https://doi.org/10.1038/s43705-023-00294-w
Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:
Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.
Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt