Diplomado en Argumentación y Narrativa Soportada en Análisis de Datos
Nuevo Beneficio: Insignia Digital
Al completar nuestros cursos o diplomados, obtendrás no solo una certificación, sino también una insignia digital. Esta insignia, está diseñada para ser compartida en plataformas como LinkedIn, lo que te permitirá destacar tu logro profesional y darle mayor visibilidad a tu perfil. De esta forma, resaltarás tu compromiso con el desarrollo y la actualización continua, lo que puede potenciar tu trayectoria en el ámbito laboral y/o profesional.
Valores y detalles del cursoDuración: 120 horas
Modalidad: Online a través de Microsoft Teams
Valor matricula: $2.000.000
Inscripciones y matriculas: 23 de septiembre al 04 de diciembre de 2024
Inicio de clases: 9 de diciembre de 2024
El análisis de datos constituye una oportunidad para la generación
de valor en el ámbito organizacional.
El análisis de datos constituye una oportunidad para la generación de valor en el ámbito organizacional. En lo académico, sus avances robustecen la metodología y los resultados de la investigación científica. Actualmente, los aportes de la ciencia de datos son aplicables en casi cualquier disciplina. Además, existen herramientas robustas y asequibles económicamente, para la recolección, análisis, visualización y prescripción. Este diplomado fortalece significativamente el perfil de un profesional de cualquier disciplina.
¿Que vas aprender?
Introducir a los estudiantes en los conceptos y herramientas propias del análisis de datos. Con esto, se busca brindar una base de conocimiento y lineamientos para una ruta de especialización autodidacta o por medio de programas de posgrado.
Este programa es dirigido a
Interesados en entrar a conocer las herramientas análisis de datos como soporte para la argumentación y la narrativa.
Conocimientos previos
Conocimientos en temas de precálculo, cálculo y estadística.
Habilidades que se van a adquirir con este conocimiento
Argumentar y discutir con datos, programación para ciencia de datos, algoritmos y visualización con herramientas profesionales.
Módulos del curso
Fundamentos de estadística descriptiva
Introducción, tipos de datos, datos cuantitativos - cualitativos - fechas - texto, estructurados - no estructurados, abiertos - cerrados, almacenamiento de datos, flujo de datos, selección de tecnologías.
Limpieza de datos, datos faltantes, datos atípicos, discretización de variables, trabajo con fechas y horas.
Transformación de tablas de datos, crear nuevas columnas, generar resúmenes, desplegar y colapsar tablas. Operaciones entre tablas de datos. Inner join, left join, right join, full join.
Datos univariados. Promedio, mediana, moda, varianza, cuartiles, rango intercuartílico.
Datos multivariados. Estadísticos de asociación: covarianza, correlación, información mutua, matriz de varianzas y covarainzas.
Descriptivos multivariados. Probabilidad condicional. Descriptivos multivariados. Valor esperado condicional.
Visualización univariada. Gráfico de barras, de densidad, histograma, de caja.
Visualización multivariada. Gráficos de dispersión, tablas highlight, combinaciones y redes.
Introducción al lenguaje de programación Python
Introducción, instalación, paquetes, entorno, notebooks, Jupyter, carga y lectura de datos.
Programación. Clases, objetos y métodos. Programación. Operaciones y funciones. Programación. Loops.
Limpieza de datos, datos faltantes, datos atípicos, discretización de variables, trabajo con fechas y horas.
Transformación de tablas de datos, crear nuevas columnas, generar resúmenes, desplegar y colapsar tablas. Operaciones entre tablas de datos. Inner join, left join., right join, full join.
Datos univariados. Promedio, mediana, moda, varianza, cuartiles, rango intercuartílico. Datos multivariados. covarianza, correlación, matriz de varianzas y covarainzas.
Valor esperado y probabilidad condicionales.
Introducción al lenguaje de programación R
Introducción, qué es R, instalación, paquetes, informes automáticos, proyectos y documentación. Carga de datos.
Programación. Objetos y clases. Programación. Operaciones y funciones. Programación. Loops.
Limpieza de datos, datos faltantes, datos atípicos, discretización de variables, trabajo con fechas y horas.
Transformación de tablas de datos, crear nuevas columnas, generar resúmenes, desplegar y colapsar tablas. Operaciones entre tablas de datos. Inner join, left join., right join, full join.
Datos univariados. Promedio, mediana, moda, varianza, cuartiles, rango intercuartílico.
Datos multivariados. covarianza, correlación, matriz de varianzas y covarainzas.
Valor esperado y probabilidad condicionales.
Minería de datos: modelos no supervisados
Introducción, definiciones. Problemas de minería de datos.
Distancias, definición, tipos, matrices de distancias.
Asociación, reglas de asociación, algoritmo a priori.
Asociación, reglas de asociación, soporte, confianza, lift.
Agrupación algoritmos generación de los clusters.
Agrupación algoritmos validación y caracterización.
Proyecto.
Machine learning: modelos supervisados
Introducción, definiciones. Problemas de aprendizaje automático
Redes neuronales. Desarrollo. Tipos de redes.
Redes neuronales: intuición matemática.
Redes neuronales: implementaciones.
Clasificación y predicción: Ajuste de modelos. Regresión lineal, regresión logit, K vecinos más cercanos, árboles de regresión, bosques aleatorios.
Clasificación y predicción: Validación de modelos
Proyecto
Semántica y visualización
Modelo - Contexto. Significado de los números. Interpretación estadística.
Significados asociados al paradigma población-muestra. Significados de estadísticos univariados.
Significado de modelos de aprendizaje supervisado y no supervisado.
Data Storytelling. Construcción de narrativas. El viaje del héroe.
Elementos visuales. Posición, longitud, saturación, color, área, ángulo, profundidad y volumen. Geometrías. Tipos de variable. Dashboards, niveles de interactividad con las visualizaciones, buenas prácticas de visualización. Selección de las gráficas adecuadas según la información."
Visualización en Python
Visualización en R
Perfil General de los egresados
El egresado estará en capacidad de realizar informes estadísticos descriptivos, procesos de limpieza y análisis de datos en los lenguajes de programación R y Python; también de implementar modelos sencillos de minería de datos y machine learning y utilizar las herramientas de análisis de datos para construir argumentos rigurosos y narrativas bien estructuradas.
Términos y condiciones
- 20% de descuento en la matrícula para estudiantes, egresados, administrativos y docentes de la universidad
- Si tiene dudas adicionales, por favor envíanos un correo a [email protected] o [email protected] o comunícate a las líneas 3174323099 - 3174317264
-
Una vez realices el pago, envía el soporte con tus datos al correo: [email protected]
- El participante recibirá un correo electrónico por parte de la universidad en el transcurso de la siguiente semana del cierre de matrículas con las indicaciones de inicio de la formación.
- El programa requiere de un mínimo de personas matriculadas para dar apertura.