Question 1

Sie entwickeln ein Empfehlungssystem für einen E-Commerce-Shop. Sie haben Benutzerinteraktionsdaten (Klicks, Käufe) und Produktmetadaten. Welcher Ansatz ist am besten geeignet, um die Genauigkeit und Vielfalt der Empfehlungen zu verbessern, insbesondere bei Kaltstart-Produkten?

Accepted Answer

Implementierung eines hybriden Ansatzes, der kollaborative Filterung mit inhaltsbasierten Methoden kombiniert, um Produktmetadaten zu nutzen.. Empfehlungssysteme stehen oft vor dem Kaltstart-Problem, insbesondere bei neuen Produkten oder Benutzern. Hybride Ansätze, die verschiedene Techniken wie kollaborative Filterung und inhaltsbasierte Filterung kombinieren, sind effektiv, um Empfehlungen auch dann zu generieren, wenn begrenzte oder keine historischen Interaktionsdaten verfügbar sind.

Question 2

Ein Unternehmen möchte ein Machine-Learning-Modell trainieren, das auf einer großen Menge unstrukturierter Textdaten basiert. Die Daten werden in Amazon S3 gespeichert. Welcher AWS-Service eignet sich am besten für die Vorverarbeitung dieser Textdaten, bevor sie für das Training verwendet werden?

Accepted Answer

AWS Glue mit speziell entwickelten ETL-Skripten, die Textverarbeitungsbibliotheken wie NLTK oder spaCy verwenden.. Die Vorverarbeitung von Textdaten ist ein entscheidender Schritt im Machine-Learning-Workflow. AWS Glue bietet eine skalierbare und flexible Plattform, um diese Daten zu bereinigen, zu transformieren und für das Training von Modellen vorzubereiten. Die Integration mit Python-Bibliotheken ermöglicht eine leistungsstarke Textanalyse.

Question 3

Welcher AWS-Service wird hauptsächlich für das Trainieren und Bereitstellen von Machine-Learning-Modellen verwendet und bietet eine integrierte Entwicklungsumgebung (IDE) für Data Scientists?

Accepted Answer

Amazon SageMaker. Amazon SageMaker ist der zentrale Dienst von AWS für den gesamten Machine-Learning-Lebenszyklus. Er bietet Werkzeuge für Datenaufbereitung, Modellbau, Training, Optimierung und Bereitstellung, was ihn zu einer umfassenden Lösung für Data Scientists macht.

Question 4

Sie trainieren ein tiefes neuronales Netz für die Bilderkennung. Die Trainingszeit ist sehr lang, und Sie möchten die Trainingsgeschwindigkeit erhöhen. Welche der folgenden Maßnahmen ist am effektivsten, um die Trainingszeit zu verkürzen?

Accepted Answer

Einsatz von mehreren GPUs und verteiltem Training über mehrere Instanzen.. Das Training von Deep-Learning-Modellen, insbesondere für komplexe Aufgaben wie die Bilderkennung, kann rechenintensiv sein. Die Parallelisierung von Berechnungen durch den Einsatz von Multi-GPU-Instanzen und verteiltem Training ist eine Schlüsselstrategie, um die Trainingszeit drastisch zu reduzieren und die Effizienz zu steigern.

Question 5

Sie möchten ein Modell für die Anomalieerkennung in Zeitreihendaten trainieren. Welcher Algorithmus, der in Amazon SageMaker verfügbar ist, eignet sich besonders gut für diese Aufgabe, ohne dass gelabelte Daten erforderlich sind?

Accepted Answer

Amazon SageMaker DeepAR. Die Anomalieerkennung in Zeitreihendaten ist entscheidend für die Überwachung von Systemen und die Erkennung von Betrug oder Fehlfunktionen. Unüberwachte Lernalgorithmen wie Isolation Forests (verfügbar als 'Unsupervised Anomaly Detection'-Algorithmus in SageMaker) sind ideal, da sie Muster in den Daten lernen und Ausreißer identifizieren können, ohne dass explizite Labels für Anomalien erforderlich sind.

AWS Certified Machine Learning - Specialty Prüfungsleitfaden

Sie entwickeln ein Empfehlungssystem für einen E-Commerce-Shop. Sie haben Benutzerinteraktionsdaten (Klicks, Käufe) und Produktmetadaten. Welcher Ansatz ist am besten geeignet, um die Genauigkeit und Vielfalt der Empfehlungen zu verbessern, insbesondere bei Kaltstart-Produkten?

Welcher AWS-Service wird hauptsächlich für das Trainieren und Bereitstellen von Machine-Learning-Modellen verwendet und bietet eine integrierte Entwicklungsumgebung (IDE) für Data Scientists?

Sie trainieren ein tiefes neuronales Netz für die Bilderkennung. Die Trainingszeit ist sehr lang, und Sie möchten die Trainingsgeschwindigkeit erhöhen. Welche der folgenden Maßnahmen ist am effektivsten, um die Trainingszeit zu verkürzen?

Sie möchten ein Modell für die Anomalieerkennung in Zeitreihendaten trainieren. Welcher Algorithmus, der in Amazon SageMaker verfügbar ist, eignet sich besonders gut für diese Aufgabe, ohne dass gelabelte Daten erforderlich sind?

Related Certifications

Local Testing

Careers