Ingeniería de datos en Microsoft Azure

En este curso, el alumno aprenderá sobre los patrones y prácticas de ingeniería de datos en lo que respecta a trabajar con soluciones analíticas por lotes y en tiempo real utilizando tecnologías de plataforma de datos de Azure.

 

Descripción

En este curso, el alumno aprenderá sobre los patrones y prácticas de ingeniería de datos en lo que respecta a trabajar con soluciones analíticas por lotes y en tiempo real utilizando tecnologías de plataforma de datos de Azure. Explorarán cómo diseñar una capa de servicio analítica y se centrarán en las consideraciones de ingeniería de datos para trabajar con archivos de origen, aprenderán distintas técnicas que pueden utilizarse para cargar datos utilizando la capacidad de Apache Spark que se encuentra en Azure Synapse Analytics o Azure Databricks, o cómo ingerir utilizando Azure Data Factory o Azure Synapse pipelines, entre otras muchas funcionalidades.

Código del Curso: IT-MCP-DP-900

Duración: 25 h

Modalidad: Presencial/Online en directo

Las tres ventajas que harán que apuestes por SQL Server en Azure 

Solicita información

 

Objetivos

  • Explorar opciones de computación y almacenamiento para cargas de trabajo de ingeniería de datos en Azure
  • Diseñar e implementar la capa de servicio
  • Comprender las consideraciones de ingeniería de datos

Requisitos

Los alumnos que aprueben este curso tendrán conocimientos sobre computación en cloud y conceptos básicos de datos, así como experiencia profesional con soluciones de datos.

¿A quién va dirigido?

El público principal de este curso son profesionales de datos, arquitectos de datos y profesionales de la inteligencia empresarial que quieren aprender sobre ingeniería de datos y construcción de soluciones analíticas utilizando tecnologías de plataformas de datos que existen en Microsoft Azure. El asistente secundario de este curso son analistas y científicos de datos que trabajan con soluciones analíticas construidas en Microsoft Azure.

 

Contenido

Módulo 1: Explorar las opciones de computación y almacenamiento para las cargas de trabajo de ingeniería de datos

  • Introducción a Azure Synapse Analytics
  • Describir Azure Databricks
  • Introducción al almacenamiento de Azure Data Lake
  • Describir la arquitectura de Delta Lake
  • Trabajar con flujos de datos utilizando Azure Stream Analytics

Módulo 2: Diseñar e implementar la capa de servicio

  • Diseñar un esquema multidimensional para optimizar las cargas de trabajo analíticas
  • Transformación sin código a escala con Azure Data Factory
  • Rellenar dimensiones que cambian lentamente en los pipelines de Azure Synapse Analytics

Módulo 3: Consideraciones de ingeniería de datos para archivos de origen

  • Diseñar un almacén de datos moderno utilizando Azure Synapse Analytics
  • Asegurar un almacén de datos en Azure Synapse Analytics

Módulo 4: Ejecutar consultas interactivas utilizando los pools SQL sin servidor de Azure Synapse Analytics

  • Explorar capacidades de los pools SQL sin servidor de Azure Synapse
  • Consultar de datos en el lago utilizando pools SQL sin servidor de Azure Synapse
  • Crear objetos de metadatos en pools SQL sin servidor de Azure Synapse
  • Proteger datos y gestionar usuarios en pools SQL sin servidor de Azure Synapse

Módulo 5: Explorar, transformar y cargar datos en el almacén de datos utilizando Apache Spark

  • Comprender la ingeniería de big data con Apache Spark en Azure Synapse Analytics
  • Ingesta de datos con notebooks Apache Spark en Azure Synapse Analytics
  • Transformar datos con DataFrames en Apache Spark Pools en Azure Synapse Analytics
  • Integrar pools de SQL y Apache Spark en Azure Synapse Analytics

Módulo 6: Exploración y transformación de datos en Azure Databricks

  • Describir Azure Databricks
  • Leer y escribir datos en Azure Databricks
  • Trabajar con DataFrames en Azure Databricks
  • Trabajar con métodos avanzados de DataFrames en Azure Databricks

Módulo 7: Ingerir y cargar datos en el almacén de datos

  • Utilizar las mejores prácticas de carga de datos en Azure Synapse Analytics
  • Ingesta a escala de petabytes con Azure Data Factory

Módulo 8: Transformar Datos con Azure Data Factory o Azure Synapse Pipelines

  • Integración de datos con Azure Data Factory o Azure Synapse Pipelines
  • Transformación sin código a escala con Azure Data Factory o Azure Synapse Pipelines

Módulo 9: Orquestar el movimiento y transformación de datos en Azure Synapse Pipelines

  • Orquestar el movimiento y la transformación de datos en Azure Data Factory

Módulo 10: Optimizar el rendimiento de las consultas con pools SQL dedicados en Azure Synapse

  • Optimizar el rendimiento de las consultas del almacén de datos en Azure Synapse Analytics
  • Comprender funciones de programador de almacén de datos de Azure Synapse Analytics

Módulo 11: Analizar y Optimizar el Almacenamiento del Almacén de Datos

  • Analizar y optimizar almacenamiento del almacén de datos en Azure Synapse Analytics
  • Diseñar un procesamiento transaccional y analítico híbrido utilizando Azure Synapse Analytics
  • Configurar Azure Synapse Link con Azure Cosmos DB
  • Consultar Azure Cosmos DB con pools de Apache Spark
  • Consultar Azure Cosmos DB con pools SQL sin servidor

Módulo 13: Seguridad de extremo a extremo con Azure Synapse Analytics

  • Asegurar un almacén de datos en Azure Synapse Analytics
  • Configurar y gestionar los secretos en Azure Key Vault
  • Implementar controles de cumplimiento para los datos sensibles

Módulo 14: Procesamiento de flujos en tiempo real con Stream Analytics

  • Habilitar la mensajería fiable para aplicaciones de Big Data utilizando Azure Event Hubs
  • Trabajar con flujos de datos utilizando Azure Stream Analytics
  • Ingerir flujos de datos con Azure Stream Analytics

Módulo 15: Crear una solución de procesamiento de flujos con Event Hubs y Azure Databricks

  • Procesar datos de streaming con el streaming estructurado de Azure Databricks

Módulo 16: Construir informes utilizando la integración de Power BI con Azure Synapse Analytics

  • Crear informes con Power BI utilizando su integración con Azure Synapse Analytics

Módulo 17: Realizar procesos de aprendizaje automático integrados en Azure Synapse Analytics

  • Utilizar el proceso de aprendizaje automático integrado en Azure Synapse Analytics

Valoraciones

No hay valoraciones aún.

Sé el primero en valorar “Ingeniería de datos en Microsoft Azure”

Tu dirección de correo electrónico no será publicada.

También te recomendamos…