Sicherstellung von Datenschutz und Compliance: Wie Mindy Support 500.000 Bilder für die Entwicklung autonomer Fahrzeuge anonymisierte
Kundenprofil:
Branche: Automobilindustrie Land: USA Unternehmensgröße: 1,000 – 2,000 Mitarbeiter
Beschreibung des Kunden:
Unser Kunde ist ein Marktführer in der Automobilindustrie, der sich Innovation, Qualität und Nachhaltigkeit verschrieben hat. Er entwickelt hochmoderne Fahrzeuge und Technologien, bei denen Sicherheit, Effizienz und umweltfreundliche Praktiken im Vordergrund stehen. Geleitet von einer kundenzentrierten Herangehensweise arbeitet er mit Partnern, um maßgeschneiderte Lösungen bereitzustellen, die den sich entwickelnden Anforderungen moderner Mobilität gerecht werden und gleichzeitig die Zukunft des Transports vorantreiben.
Art der Annotation
Anonymisierung von Straßenszenen, Data Annotation, Qualitätssicherung
Beschreibung des Projekts
Durch die Anonymisierung eines Datensatzes aus 500.000 Video Frames konnte unser Kunde alle DSGVO und CCPA-Vorschriften einhalten und gleichzeitig die Straßenszenen in den Aufnahmen für Analysen nutzen. Mithilfe fortschrittlicher Bildbearbeitungstechniken identifizierte und anonymisierte das Mindy Support Team personenbezogene Aufnahmen wie Gesichter oder Kennzeichen. Kritische Elemente in den Aufnahmen, die für die Entwicklung autonomer Fahrzeuge und Erkenntnisse zum Verkehrsmanagement erforderlich sind, wurden beibehalten. Unsere skalierbare und effiziente Lösung zur Anonymisierung personenbezogener Daten gewährleistete die vollständige Einhaltung aller relevanten Datenschutzrichtlinien und ermöglichte es unserem Kunden, seine Daten verantwortungsvoll zu nutzen, ohne deren analytische Präzision zu beeinträchtigen.
Ausgangslage
Um die Entwicklung autonomer Fahrzeuge und Verkehrsmanagementsysteme zu verbessern, musste unser Kunde aus der Automobilindustrie einen großen Datensatz von Straßenaufnahmen verarbeiten. Die Videos enthielten Aufnahmen verschiedener städtischer und ländlicher Umgebungen, enthielten aber auch vertrauliche oder personenbezogene Informationen wie Nummernschilder, Gesichter, Poster oder Firmennamen. Um Datenschutzrichtlinien wie die DSGVO und den CCPA einzuhalten, müssen diese Informationen in den Aufnahmen anonymisiert werden. Ohne Anonymisierung können die Daten von unserem Kunden nicht genutzt werden, ohne rechtliche und ethische Konsequenzen zu riskieren.
Das Ziel des Kunden bestand darin, 500.000 Bilder zu anonymisieren und dabei sicherzustellen, dass personenbezogene und vertrauliche Informationen wie Nummernschilder und Gesichter unscharf gemacht oder maskiert wurden. Aufgrund der großen Menge an Daten musste ein Weg gefunden werden, eine sehr große Menge an Daten innerhalb einer angemessenen Zeit zu anonymisieren. Dabei mussten geltende Datenschutzbestimmungen eingehalten werden und die Integrität der Bilder für weitere Analysen sichergestellt sein. Die Bilder sollten also nach der Anonymisierung weiterhin für wichtige Erkenntnisse im Bereich autonomes Fahren und Verkehrsmanagement genutzt werden können. Mit diesem Ansatz wollte unser Kunde seine Daten verantwortungsvoll unter der Einhaltung aller Datenschutzstandards nutzen, gleichzeitig aber weiter an Technologiefortschritt arbeiten.
Warum Mindy Support
Der Kunde wandte sich an Mindy Support, da wir schon in der Vergangenheit als Data Annotation Dienstleister für den Kunden tätig waren und hervorragende Leistungen in früheren Projekten erbracht hatten. Im Laufe unserer Zusammenarbeit entwickelten wir ein Verständnis für die besonderen Bedürfnisse und Erwartungen des Kunden und boten ihm genau das, was er für die Anonymisierung großer Datenmengen benötigte. Unsere Erfahrung in der Datenverarbeitung und unser Engagement für Qualität machten uns zu einem echten Partner, bei dem der Kunde Vertrauen in unsere Fähigkeit hatte, die Aufgabe effizient und effektiv zu bewältigen. Durch unsere Erfolgsbilanz bekamen wir den Zuschlag alle Bilder zu anonymisieren.
Bereitgestellte Data Annotation Lösung
Wir begannen mit der Implementierung eines zweistufigen Prozesses, der KI-gesteuerte Tools mit einer manuellen Prüfung der maschinellen Annotationen kombinierte. Wir setzten auf fortschrittliche Algorithmen, die in der Lage sindpersonenbezogene Informationen wie Nummernschilder oder Gesichter zu erkennen und zu anonymisieren. Um Fehler insbesondere bei Edge Cases zu identifizieren und beseitigen führten wir im Anschluss eine manuelle Überprüfung der KI-Ausgaben durch. Dieses zweistufige Verfahren aus maschineller und Annotation und manueller Prüfung von Edge Cases gewährleistete die vollständige Einhaltung aller Datenschutzbestimmungen, einschließlich, aber nicht beschränkt auf DSGVO und CCPA, ohne die Qualität und Nützlichkeit der anonymisierten Daten für den Einsatz in ihren Anwendungen für autonome Fahrzeuge und Verkehrsmanagement zu beeinträchtigen.
Unsere Data Annotation Dienstleistungen umfassten dabei:
- Implementierung eines Algorithmus für Pre-Annotation – In der Anfangsphase des Projekts wurden Computer Vision Tools eingesetzt, die in der Lage sind, Kennzeichen und Gesichter zu identifizieren. Die dahinterstehenden KI-Modelle wurden darauf trainiert, diese selbst in unterschiedlichen Lichtverhältnissen, Wetterbedingungen oder Winkeln zu erkennen, sodass sie in den meisten Fällen korrekt erkannt wurden. Der Rückgriff auf automatisierte Annotation beschleunigte die Anonymisierung erheblich und reduzierte den manuellen Arbeitsaufwand auf die Prüfung von Edge Cases in sensiblen Bereichen.
- Manuelle Prüfung auf Edge Cases – Angesichts der Komplexität realer Umgebungen sind selbst gut trainierte Computer Vision Tools nicht in der Lage, einen 100% genauen Output zu generieren. Daher überprüften unsere Data Annotatoren die von der KI markierten Frames manuell auf fehlende oder falsch identifizierte personenbezogene Informationen. Dieser Schritt war unerlässlich, da bestimmte Umgebungsfaktoren wie Blendung, Schatten oder teilweise verdeckte Objekte die KI gelegentlich daran hinderten, personenbezogene Informationen vollständig zu erkennen.
- Workload und Projektmanagement – Um der großen Anzahl an Bildern Herr zu bleiben und Skalierbarkeit sicherzustellen, wurde der Datensatz in kleinere Batches aufgeteilt, sodass jedes Teammitglied des 30-köpfigen Data Annotation Teams als einzelne Einheit Bilder annotierte. Ein Teamleiter und Trainer stellten sicher, dass jeder im Data Annotation Team nach standardisierten Verfahren vorging. Auf diese Weise wurden eine effiziente Geschwindigkeit bei der Annotation und die Konsistenz des Outputs erzielt.
- Qualitätskontrolle – Unsere Abteilung für Qualitätssicherung führte gründliche Kontrollen durch, um eine qualitativ hochwertige Anonymisierung der Daten sicherzustellen. Alle Batches wurden überprüft, um Fehler bei der automatisierten Annotation zu bereinigen. Die Vorgehensweise bei der Qualitätskontrolle war iterativ. Alle fehlerhaften Annotationen wurden korrigiert und zur erneuten Überprüfung freigegeben, um Konformität sicherzustellen, bevor der Datensatz fertiggestellt wurde.
Ergebnisse
- 500,000 anonymisierte Straßenszenen
- 99%+ Genauigkeit