Curso

Nombre Sélem Mojica Nelly
Curso Temas selectos de estadística II - 3 hrs/sem
Tema Análisis estadistico de datos de microbioma
Objetivo El curso tiene como objetivo proveer las bases biológicas, estadísticas, computacionales y de matemáticas aplicadas, para abordar problemas de análisis de datos y clasificación de grandes bases de datos que se originan en la ciencias genómicas.

El curso está orientado para estudiantes de posgrados de cualquiera de estas cuatro áreas y busca fortalecer una visión multidisciplinaria de este tipo de problemas, al mismo tiempo que busca crear equipos multidisciplinarios que puedan participar en el congreso CAMDA de 2024 y su reto científico y big data de ese año.
Temario Temario (32 sesiones)
Bloque 1 Introducción a la metagenómica.
(Descripcion de los datos: metagenomas y amplicones, índices de diversidad, redes?, reconstruccion de genomas: Bacteria, Archaeae, Virus y Euka, inferencia taxonomica y funcional con lecturas crudas, metatranscriptomas?) R

Qué son los datos de microbioma
Microbiomas urbanos
Introducción al análisis estadístico alfa y beta diversidades de microbioma
Redes de co-ocurrencia

Bloque 2 Modelos estadísticos e inferencia
Qué es una hipótesis y filosofía
Estadística de prueba y p-valor
Neyman-Pearson: región crítica y potencia
Ejemplos: anova, t-tests, chi-square test.
Análisis de comunidades (univariado y multivariado)
Análisis de composición de datos de microbioma
Tratando la sobre dispersión de los datos
Tratando los datos sobre inflados en el cero
Modelos conjuntos para medidas con repetición
Métodos estadísticos para la identificación en estudios de microbioma
Modelo logístico para estimar el sesgo en estudios de microbioma

Bloque 3 Método Bayesiano
Densidades y densidades condicionales, Probabilidad total, regla multiplicativa y Teorema de Bayes
Paradigma bayesiano y un ejemplo
MCMC: cálculo de la posterior
Regresión Dirichlet-Multinomial para datos de microbioma
Taxonomia operacional bayesiana


Bloque 5 Machine learning para clasificación
Python
Análisis descriptivo de los datos
Regresión y Clasificación: Regresión logística
Aprendizaje supervisado y no supervisado
Random Forest y Support Vector Machine
Redes neuronales: Introducción a las redes neuronales, Perceptrón multicapas, Algoritmos de optimización, Redes convolucionales y Redes recurrentes.

Bloque 6 Lectura de Artículos y problemas actuales
Lectura de artículos ganadores de reto forense de 2016-2023
Presentación de problemas actuales de microbiomas con invitados
Microbiomas de Mar Mirna Vazquez
Microbiomas Agave Laila Partida
Bibliografía BIBLIOGRAFÍA BÁSICA
Libros
Yinglin Xia · Jun Sun · Ding-Geng Chen.Statistical Analysis of Microbiome Data with R. ICSA Book Series in Statistics
Zhong Wang Introduction to Computational Metagenomics. https://doi.org/10.1142/12425 DOE Joint Genome Institute, USA & Lawrence Berkeley National Lab, USA.
Somnath Datta, Subharup Guha Statistical Analysis of Microbiome Data. Springer Nature Switzerland AG 2021. https://doi.org/10.1007/978-3-030-73351-3

Artículos
Albert Barberán, Scott T Bates, Emilio O Casamayor & Noah Fierer Using network analysis to explore co-occurrence patterns in soil microbial communities ISME 2011

. Calle M Luz. Statistical analysis of metagenomics data. Genomics and Bioinformatics 2019

. Amy Y.Pan Statistical analysis of microbiome data: The challenge of sparsity. Endocrine and Metabolic Research. 2021

Assessment of urban microbiome assemblies with the help of targeted in silico gold standards Samuel M. Gerner, Thomas Rattei & Alexandra B. Graf
Unraveling City-Specific Microbial Signatures and Identifying Sample Origins for the Data From CAMDA 2020 Metagenomic Geolocation Challenge Runzhi Zhang, Dorothy Ellis, Alejandro R. Walker Susmita Datta
Identification of city specific important bacterial signature for the MetaSUB CAMDA challenge microbiome data Alejandro R. Walker & Susmita Datta
Origin Sample Prediction and Spatial Modeling of Antimicrobial Resistance in Metagenomic Sequencing Data Maya Zhelyazkova, Roumyana Yordanova, Iliyan Mihaylov, Stefan Kirov, Stefan Tsonev, David Danko, Christopher Mason, Dimitar Vassilev
A global metagenomic map of urban microbiomes and antimicrobial resistance "
David Danko, Daniela Bezdan, Evan E. Afshin, Sibo Zhu, Christopher E. Mason "
Requisitos A los alumnos del CCM se les recomienda el curso de estadística del Dr Eugenio Balanzario

Hay que saber lo mínimo de python y r, o bien consultar los cursos
https://carpentries-incubator.github.io/metagenomics-workshop/ para R
Que de cualquier manera impartirá el Dr Shaday en el CCM y puede tomarse virtualmente las lecciones que se necesiten
lo mínimo de Python lo pueden encontrar aquí https://swcarpentry.github.io/python-novice-gapminder/

Por favor escriban si tienen dudas sobre si cumplen los requerimientos.
Comentarios Este curso comenzará virtual, el 15 de Enero y terminará el 28 de mayo, para que puedan tomarlo tb estudiantes de CINVESTAV y CIMAT. La participación de estudiantes provenientes de varias formaciones enriquecerá las discusiones.
Registro 2023-11-16