Program
Habilidades Digitales
Continuing Education

Data Analysis with Python Program

360 Hours

Estimated learning time

Self-Paced

Progress at your own speed

Popular course

A popular course among students

About the Program

Description

COURSE DELIVERY IS IN SPANISH: Certificates can start/end at any time within a 6-month range. Please contact Tecmilenio if you need a different Start Date.

In this program, you will learn database fundamentals, advanced Machine Learning techniques, and data processing and analysis using SQL, MongoDB, R, and Python.

En este programa, aprenderás los fundamentos de bases de datos, técnicas avanzadas de Machine Learning, y procesamiento y análisis de datos utilizando SQL, MongoDB, R y Python.

Topics

  • Módulo 1. Introducción a Bases de Datos 1. Fundamentos de SQL 2. Agrupaciones y subconsultas 3. Joins y Vistas 4. Configuración de Bases de Datos Locales 5. Fundamentos de MongoDB 6. Consultas en MongoDB 7. Agregaciones 8. Query competition Módulo 2. Programación y estadística con R 1. Introducción a la programación y estadística con R 2. Programación con Objetos, Funciones, Condiciones y Loops 3. Utilización de Scripts en R con aplicaciones para el análisis de datos 4. Integración de R con Bases de datos SQL, MongoDB y datos de dominio público (URL) 5. Estadística I. Análisis Exploratorio de datos: Análisis univariado y multivariado 6. Estadística II. Distribuciones muestrales y paramétricas 7. Modelado Matemático: Regresión y Predicción 8. Gráficos Avanzados Módulo 3. Procesamiento de datos con Python 1. Fundamentos de Python 2. Estructuras de Datos y Funciones 3. Programación funcional 4. Pandas y Análisis Exploratorio de Datos 5. Funciones Vectorizadas y Limpieza de Datos 6. APIs, automatización y concatenación de DataFrames 7. Transformación, filtración y ordenamiento de datos 8. Bases de datos, merge y agrupaciones Módulo 4. Análisis de datos con Python 1. Estimados de locación y variabilidad 2. Introducción a la visualización de datos: Distribuciones 3. Exploración de Variables Categóricas y Análisis Multivariable 4. Correlaciones y Regresión Linear Simple 5. Distribuciones Muestrales y Técnicas de Evaluación de Modelos 6. Visualización de Datos Avanzada 7. Pruebas A/B y Procesamiento de Lenguaje Natural 8. Introducción a Machine Learning: Clasificación No Supervisada y Supervisada Módulo 5. Machine Learning 1. Introducción a Machine Learning 2. Separación, validación y evaluación para algoritmos de ML 3. Algoritmos no supervisados 4. Problemas de regresión 5. Árboles de decisión 6. Clasificación y Redes Neuronales Artificiales 7. Arena de Clasificadores 8. Fundamentos de Procesamiento de Imágenes"

Prerequisites

  • El aprendedor postulante deberá tener conocimiento de la lógica de programación, también deberá contar con conocimientos básicos en estadística y extracción de datos, en lenguaje Python, R y machine learning.

Total Cost: $2,412.50

0 Program Products

    Deliverables

    • 0 Credits

      Academic Excellence

      Earn necessary number of credit hours for completing this content

    • Hone Important Skills

      Total Upgrade

      Such as Manipula una gran cantidad de datos a través de diversos lenguajes, librerías y modelos de regresión para para crear estrategias de negocio, revelar tendencias y tomar decisiones.

    Outcomes

    El aprendedor podrá:
    • Generar un conjunto de datos a partir de la manipulación de bases de datos relacionales y no relacionales para su posterior análisis, con el fin de seguir buenas prácticas para diseñar y ejecutar poderosas y eficientes consultas SQL y NoSQL.
    • Realizar tareas de limpieza, manipulación y análisis de bases de datos utilizando el lenguaje de programación R, para después poder crear visualizaciones, predicciones y modelaje matemático, que permitirán transformar datos en información para mejorar la toma decisiones en las organizaciones.
    • Utilizar Python para crear rutinas y scripts que permitan automatizar la obtención, limpieza, procesamiento y transformación datos provenientes de diferentes fuentes y formatos como: archivos locales, APIs y bases de datos externas con el fin de tener data en condiciones óptimas para su futuro análisis y visualización.
    • Utilizar Python y sus librerías para realizar análisis robustos de datos, aplicando modelos estadísticos y matemáticos que permitan encontrar patrones y elaciones en los datos con el fin de generar visualizaciones de análisis univariados, bivariados y multivariados con Seaborn y Matplotlib y aplicar modelo de regresión, clasificación y predicción.

    Outcomes Image