Question 1

Al optimizar el rendimiento de las consultas en Azure Synapse Analytics, se observa que ciertas consultas complejas sobre grandes tablas están tardando demasiado. Se está utilizando el modelo de distribución 'Hash' para una tabla de hechos. ¿Qué estrategia de distribución de tablas podría mejorar el rendimiento de las consultas en este escenario?

Accepted Answer

Cambiar a 'Hash' sobre una columna diferente. La distribución de tablas en Azure Synapse Analytics es crucial para el rendimiento de las consultas. La distribución 'Hash' coloca filas con valores de clave de hash idénticos en el mismo nodo de cómputo. Elegir la columna de distribución correcta, a menudo una columna utilizada en uniones frecuentes, puede minimizar el movimiento de datos y acelerar las consultas.

Question 2

Una empresa está diseñando una solución de análisis de datos en Azure que requiere el procesamiento de grandes volúmenes de datos semiestructurados y no estructurados. Se necesita una solución de almacenamiento escalable y rentable que admita la ingesta de datos en tiempo real y por lotes. ¿Qué servicio de Azure es el más adecuado para este escenario?

Accepted Answer

Azure Data Lake Storage Gen2. Azure Data Lake Storage Gen2 es un servicio de almacenamiento de análisis de propósito general que optimiza el rendimiento para cargas de trabajo de análisis de big data. Permite almacenar grandes cantidades de datos de forma jerárquica y rentable, siendo ideal para escenarios que involucran datos estructurados, semiestructurados y no estructurados.

Question 3

Se requiere implementar un flujo de trabajo en Azure que ingiera datos de múltiples fuentes, los transforme y los cargue en un data warehouse para su análisis. El flujo de trabajo debe ser orquestado y programado. ¿Qué servicio de Azure es la opción más adecuada para la orquestación y automatización de estos flujos de datos?

Accepted Answer

Azure Data Factory. Azure Data Factory es un servicio de ETL (Extract, Transform, Load) y ELT (Extract, Load, Transform) basado en la nube. Permite automatizar y orquestar el movimiento y la transformación de datos desde diversas fuentes hacia destinos como Azure Synapse Analytics, Azure Data Lake Storage y Azure SQL Database.

Question 4

¿Cuál de los siguientes servicios de Azure se utiliza principalmente para el procesamiento de datos en tiempo real y el análisis de streaming?

Accepted Answer

Azure Stream Analytics. Azure Stream Analytics es un servicio de análisis y procesamiento de eventos en tiempo real totalmente administrado. Permite ejecutar consultas complejas sobre flujos de datos de entrada provenientes de fuentes como Azure Event Hubs y Azure IoT Hub, generando resultados en tiempo real.

Question 5

Una organización está migrando su infraestructura de datos on-premises a Azure. Necesitan una solución que ofrezca un data warehouse escalable y de alto rendimiento para cargas de trabajo analíticas complejas, con la capacidad de integrar datos de diversas fuentes y soportar consultas SQL complejas. ¿Qué servicio de Azure se alinea mejor con estos requisitos?

Accepted Answer

Azure Synapse Analytics. Azure Synapse Analytics es una plataforma de análisis unificada que acelera la obtención de información de todos los datos. Combina la integración de datos empresarial, el almacenamiento de datos empresariales y el análisis de big data, permitiendo ejecutar consultas SQL a gran escala y análisis de machine learning en un único entorno.

Guía del examen DP-203 (Microsoft Azure Data Engineer)

¿Cuál de los siguientes servicios de Azure se utiliza principalmente para el procesamiento de datos en tiempo real y el análisis de streaming?

Related Certifications

Local Testing

Careers