Guide de l'examen Databricks Certified Data Engineer Associate

La certification **Databricks Data Engineer Associate** valide votre capacité à utiliser la plateforme Databricks pour effectuer des tâches d'ingénierie des données de base. Elle couvre l'architecture Lakehouse, ETL avec Spark SQL et Python, et la gestion des pipelines Delta Live Tables.

Qu'est-ce qu'une table 'Delta' dans Databricks ?

Réponse : Une couche de stockage optimisée qui apporte des transactions ACID au stockage objet.

Delta Lake permet d'avoir la fiabilité des bases de données SQL sur des Data Lakes.

Quel composant de Databricks permet d'orchestrer des workflows de traitement de données ?

Réponse : Databricks Jobs.

Permet de planifier et d'exécuter des notebooks, des fichiers JAR ou des scripts Python.

Comment s'appelle l'architecture qui combine lac de données et entrepôt de données ?

Réponse : Lakehouse.

L'architecture Lakehouse unifie le meilleur des deux mondes via le format Delta.

Qu'est-ce que 'Spark SQL' ?

Réponse : Un module Spark permettant de traiter des données structurées avec du SQL.

Offre une interface familière pour manipuler des DataFrames Spark.

Quelle est la fonction de 'Unity Catalog' ?

Réponse : Fournir une gouvernance unifiée des données et de l'IA sur l'ensemble de la plateforme Databricks.

Permet de gérer les accès, l'audit et le lignage des données de manière centralisée.

Certifications associées

Passer l'examen localement

Carrières

preload
preload
preload
preload
preload
preload