¿Qué vas a lograr?

APIs autenticadas

Trabajarás con tokens Bearer, paginación, manejo de errores y reintentos.

Transformaciones avanzadas

JSON anidado, lógica de negocio, normalización y validación profesional.

Despliegue real

Llevarás tu pipeline a producción con configuración por ambiente.

Monitoreo con CloudWatch

Logs en la nube y alertas automáticas cuando algo falle.

Temario

4 módulos — 2 semanas cada uno

✅ El primer módulo es completamente gratis — prueba sin compromiso

Módulo 1 — Extracción Avanzada +

GRATIS Semanas 1–2 · 6h en vivo + 6h práctica + 4h teoría

Conceptual

  • API key (repaso) vs tokens Bearer — diferencias
  • Autenticación con tokens: qué es un Bearer token
  • Headers HTTP y para qué se usan
  • Paginación: por qué las APIs no devuelven todo de una vez
  • Rate limiting y cómo respetarlo
  • Códigos HTTP: 200, 400, 401, 403, 404, 429, 500

Técnico

  • Bearer token en requests
  • Paginación: recorrer múltiples páginas
  • Manejo de errores: try/except, status_code
  • Reintentos ante fallos temporales (429, 500)
  • JSON anidado: estructuras complejas
  • Guardar en S3 de forma incremental

Módulo 2 — Transformación Avanzada +

Semanas 3–4 · 6h en vivo + 6h práctica + 4h teoría

Conceptual

  • Lógica de negocio vs lógica técnica
  • Mapeo de campos: origen → destino (documentación profesional)
  • Normalización: separar datos en múltiples tablas
  • Calidad de datos: validaciones antes de cargar
  • Adaptarse a las reglas del cliente

Técnico

  • pandas: json_normalize para aplanar JSON anidado
  • Merge de DataFrames (JOIN en pandas)
  • .apply() con funciones custom
  • Validación: asserts, conteos, tipos
  • Manejo de fechas y formatos
  • Módulo logging de Python (INFO, WARNING, ERROR)
  • Leer/guardar datos procesados en S3

Módulo 3 — Carga e Integración +

Semanas 5–6 · 6h en vivo + 6h práctica + 4h teoría

Conceptual

  • Integrar datos en un modelo que ya existe
  • Integridad referencial: foreign keys, orden de inserción
  • Full load vs incremental
  • Permisos parciales: simulación de ambiente de cliente
  • Manejo de errores en carga

Técnico

  • SQL intermedio: ALTER TABLE, foreign keys, ON CONFLICT (upsert)
  • SQLAlchemy: ORM básico
  • Inserción respetando dependencias
  • Carga incremental: detectar datos nuevos
  • Transacciones: commit y rollback
  • Validación post-carga

Módulo 4 — Despliegue y Monitoreo +

Semanas 7–8 · 6h en vivo + 6h práctica + 4h teoría

Conceptual

  • Ambiente productivo vs desarrollo
  • Configuración por ambiente: variables de entorno
  • CI: concepto de automatizar validación de código
  • Monitoreo con CloudWatch: por qué y cómo
  • Alertas: qué monitorear y cómo notificar

Técnico

  • Variables de entorno (.env, config.py)
  • Git avanzado: branches, merge, pull requests
  • Desplegar pipeline en ambiente productivo
  • CloudWatch Logs con boto3: create_log_group, put_log_events
  • Visualizar logs en consola de AWS
  • Crear alerta básica en CloudWatch
  • README completo y diagrama del flujo

¿Para quién es este curso?

Candidato ideal

  • Egresados del curso Flujo de Datos I
  • Analistas de negocio que necesitan automatizar la preparación de datos
  • QA y testers que trabajan con datos y quieren entender los flujos que alimentan sus sistemas
  • Desarrolladores que quieren entender un flujo de datos productivo
  • Personas con conocimientos básicos de datos que buscan nivel junior

Requisitos

  • APIs con Python requests (públicas y con API key)
  • S3 con boto3 (upload, download)
  • pandas (DataFrames, filtrado, limpieza, agrupación)
  • SQL básico (CREATE, INSERT, SELECT, WHERE, JOIN)
  • PostgreSQL con psycopg2
  • Git básico (init, add, commit, push)
  • Se recomienda haber completado Flujo de Datos I

¿Qué incluye?

Clases en Vivo

3 horas por semana con instructor activo en la industria.

Laboratorio AWS 24/7

VM + S3 + CloudWatch disponibles en todo momento.

Seguimiento Personalizado

Tu avance se monitorea semanalmente. Si te atrasas, te contactamos para ayudarte a retomar el ritmo.

Material y Práctica Offline

Guías de teoría y práctica para trabajar a tu ritmo, desde cualquier dispositivo.

Evaluación Semanal

Entregable teórico y práctico cada semana.

Constancia de Finalización

Documento que acredita la conclusión del curso y las habilidades desarrolladas.

Empieza hoy

Precio de lanzamiento — 50% OFF
$3,999 MXN
$1,999 MXN

48 horas totales · 8 semanas · Laboratorio incluido · Seguimiento personalizado

El primer módulo es gratis — prueba sin compromiso

    ¿Tienes dudas? Escríbenos a contacto@tekitdata.com

    Cursos recomendados

    Nivel Cero

    Fundamentos Tech

    Consola AWS, Unix Bash y Python desde cero.

    4 semanas · 24 horas

    Ver detalle
    Principiante

    Flujo de Datos I

    Tu primer pipeline: APIs, pandas, SQL y PostgreSQL.

    6 semanas · 36 horas

    Ver detalle

    ¿Te interesa conocer más opciones?