Logotipo del repositorio
 

Benchmarking AI-based Plasmid Annotation Tools for Antibiotic Resistance Genes Mining From Metagenome of the Virilla River, Costa Rica

dc.contributor.authorRojas-Villalta, Dorian
dc.contributor.authorCalderón-Osorno, Melany
dc.contributor.authorBarrantes, Kenia
dc.contributor.authorArias-Andres, Maria
dc.contributor.authorRojas-Jiménez, Keilor
dc.date.accessioned2025-03-31T21:15:57Z
dc.date.available2025-03-31T21:15:57Z
dc.date.issued2023-11-28
dc.descriptionEsta investigación contó con el apoyo parcial de una asignación de máquina en el superordenador Kabre del Centro Nacional de Alta Tecnología de Costa Rica.
dc.description.abstractBioinformatics and Artificial Intelligence (AI) stand as rapidly evolving tools that have facilitated the annotation of mobile genetic elements (MGEs), enabling the prediction of health risk factors in polluted environments, such as antibiotic resistance genes (ARGs). This study aims to assess the performance of four AI-based plasmid annotation tools (Plasflow, Platon, RFPlasmid, and PlasForest) by employing defined performance parameters for the identification of ARGs in the metagenome of one sediment sample obtained from the Virilla River, Costa Rica. We extracted and sequenced complete DNA from the sample, assembled the metagenome, and then performed the plasmid prediction with each bioinformatic tool, and the ARGs annotation using the Resistance Gene Identifier web portal. Sensitivity, specificity, precision, negative predictive value, accuracy, and F1-score were calculated for each ARGs prediction result of the evaluated plasmidomes. Notably, Platon emerged as the highest performer among the assessed tools, exhibiting exceptional scores. Conversely, Plasflow seems to face difficulties distinguishing between chromosomal and plasmid sequences, while PlasForest has encountered limitations when handling small contigs. RFPlasmid displayed diminished specificity and was outperformed by its taxon-dependent workflow. We recommend the adoption of Platon as the preferred bioinformatic tool for resistome investigations in the taxon-independent environmental metagenomic domain. Meanwhile, RFPlasmid presents a compelling choice for taxon-dependent prediction due to its exclusive incorporation of this approach. We expect that the results of this study serve as a guiding resource in selecting AI-based tools for accurately predicting the plasmidome and its associated genes.
dc.description.abstractLa bioinformática y la Inteligencia Artificial (IA) se erigen como herramientas de rápida evolución que han facilitado la anotación de elementos genéticos móviles (MGEs), permitiendo la predicción de factores de riesgo para la salud en ambientes contaminados, como los genes de resistencia a antibióticos (ARGs). Este estudio pretende evaluar el rendimiento de cuatro herramientas de anotación de plásmidos basadas en IA (Plasflow, Platon, RFPlasmid y PlasForest) empleando parámetros de rendimiento definidos para la identificación de ARGs en el metagenoma de una muestra de sedimento obtenida del Río Virilla, Costa Rica. Extrajimos y secuenciamos el ADN completo de la muestra, ensamblamos el metagenoma, y luego realizamos la predicción de plásmidos con cada herramienta bioinformática, y la anotación de ARGs utilizando el portal web Resistance Gene Identifier. Se calcularon la sensibilidad, especificidad, precisión, valor predictivo negativo, exactitud y puntuación F1 para cada resultado de predicción de ARGs de los plasmidomas evaluados. En particular, Platon resultó ser la herramienta de mayor rendimiento entre las evaluadas, con puntuaciones excepcionales.Por el contrario, Plasflow parece tener dificultades para distinguir entre secuencias cromosómicas y plasmídicas, mientras que PlasForest ha encontrado limitaciones al manejar contigs pequeños. RFPlasmid mostró una especificidad disminuida y fue superado por su flujo de trabajo dependiente de taxones. Recomendamos la adopción de Platon como la herramienta bioinformática preferida para las investigaciones del resistoma en el ámbito de la metagenómica ambiental independiente de los taxones. Mientras tanto, RFPlasmid presenta una opción convincente para la predicción dependiente de taxones debido a su incorporación exclusiva de este enfoque. Esperamos que los resultados de este estudio sirvan de guía en la selección de herramientas basadas en IA para predecir con precisión el plasmidoma y sus genes asociados.
dc.description.procedenceInstituto Regional de Estudios en Sustancias Tóxicas
dc.description.sponsorshipCosta Rica National High Technology Center (CeNAT)
dc.description.sponsorshipInstituto Tecnológico de Costa Rica
dc.description.sponsorshipUniversidad Estatal a Distancia
dc.description.sponsorshipUniversidad de Costa Rica
dc.identifier.doi10.1109/BIP60195.2023.10379392
dc.identifier.urihttps://hdl.handle.net/11056/30495
dc.language.isoeng
dc.publisherUniversidad Nacional, Costa Rica
dc.rightsAcceso abierto
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectARTIFICIAL INTELLIGENCE
dc.subjectDRUG RESISTANCE
dc.subjectMICROORGANISMS
dc.subjectPREDICTION
dc.subjectGENES
dc.subjectINTELIGENCIA ARTIFICIAL
dc.subjectRESISTENCIA A MEDICAMENTOS
dc.subjectMICROORGANISMOS
dc.subjectPREDICCIÓN
dc.titleBenchmarking AI-based Plasmid Annotation Tools for Antibiotic Resistance Genes Mining From Metagenome of the Virilla River, Costa Rica
dc.typehttp://purl.org/coar/resource_type/c_816b

Archivos

Bloque original

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
1.2023-Rojas-Villalta.pdf
Tamaño:
1.3 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
919 B
Formato:
Item-specific license agreed upon to submission
Descripción: