OPTISCHE ZEICHENERKENNUNG IN 14 SPRACHEN MIT 99% GENAUIGKEIT

BEREITGESTELLTE DIENSTLEISTUNG: Text Annotation

VERÖFFENTLICHT: 19.08.2022

LESEZEIT: 4 min

Kundenprofil:

Branche: IT & Softwareentwicklung

Land: USA

Unternehmensgröße: 5.000+ Mitarbeiter

Beschreibung des Kunden:

Der Kunde entwickelt eine OCR-Technologie (Optical Character Recognition), die in verschiedene Applikationen integriert wird, um Text zu erkennen, zu transkribieren und anschließend zu übersetzen.

Art der Annotation:

Optische Zeichenerkennung (OCR), Text Annotation, Validierung, Qualitätskontrolle

Ausgangslage

Der Kunde arbeitete an einem Großprojekt mit kleineren Teilprojekten in verschiedenen Sprachen: Deutsch, Französisch, Spanisch, Schwedisch, Englisch, Ukrainisch, Russisch und Türkisch. Gesucht wurde ein Data Annotation Dienstleister, der verschiedene Textarten erkennen und in Bildern mit einer Genauigkeit von 99% annotieren konnte. Die Texte in den Bildern waren sowohl im lateinischen als auch im kyrillischen Alphabet verfasst.

Warum Mindy Support

Mehrere Faktoren trugen dazu bei, dass der Kunde sich für Mindy Support entschied. Zu diesem Zeitpunkt arbeiteten wir bereits seit vier Jahren an Projekten, bei denen optische Zeichenerkennung eine Rolle spielte. Aufgrund mehrerer Standorte in Europa mit internen Data Annotation Experten verfügten wir bereits über Mitarbeiter, die verschiedene Sprachen beherrschten. Darüber hinaus verfügten wir über nachweisbare Kompetenzen in Qualitätsmanagement, auch in Projekten, die eine außergewöhnliche Genauigkeit erfordern. Wir waren bereit, eine Genauigkeit von mindestens 99% zu garantieren. Wichtig war auch das Thema Skalierbarkeit ohne Qualitätsverluste. Da Mindy Support über einen der größten Pools an Data Annotation Mitarbeitern in Europa verfügt und unsere Recruitment- und HR-Abteilungen auf Großprojekte ausgerichtet sind, konnten wir den Kunden davon überzeugen, dass wir in der Lage waren das Data Annotation Team schnell auf einige Hundert Mitarbeiter zu skalieren.

Bereitgestellte Data Annotation Lösung

Da es sich zusammen genommen um ein komplexes Großprojekt handelte, stellten wir drei Projektteams aus unterschiedlichen Fachbereichen zusammen, die den drei Phasen des Gesamtprojektes entsprachen:

  • Team Data Annotation
  • Team Validierung
  • Team Qualitätssicherung

Das Team Data Annotation wurde innerhalb von nur 1.5 Monaten auf 350 Mitarbeiter skaliert, ohne dass die Genauigkeit der Annotationen beeinträchtigt wurde. Der Datensatz wurde in verschiedene Sprachen geteilt und jede Sprache hatte ein eigenes Team, das an der optischen Zeichenerkennung in der jeweiligen Sprache arbeitete. Die Bilder mussten beschriftet und der in ihnen enthaltene Text in entweder im lateinischen oder kyrillischen Alphabet getippt werden. Im Anschluss an die Annotation arbeitete das Team Qualitätssicherung eng mit dem Kunden zusammen, um sicherzustellen, dass alle Qualitätsparameter stimmten. Wir stellten detaillierte Berichte und Statistiken zur Verfügung, um Transparenz herzustellen und Einsichten in den Verlauf des Projektes zu ermöglichen. Da das Team Qualitätssicherung unabhängig vom Team Data Annotation und Team Validierung arbeitete, übernahm es die Funktion eines internes QA Teams, sodass der Kunde sich den Aufbau interner Qualitätssicherung für das Projekt sparen konnte.

Dank sorgfältiger Planung und der Fähigkeit, effektive Arbeitsabläufe zwischen den verschiedenen Teams aufzubauen, konnten wir in 99,5% der Fälle das erforderliche Qualitätsniveau von über 99% erreichen. Während des gesamten Projektverlaufes war der Kunde mit unseren Fortschritten, Ergebnissen und der Fähigkeit, Fristen einzuhalten, sehr zufrieden, sodass sich das Projekt zu einer langfristig erfolgreichen Zusammenarbeit mit Folgeprojekten in insgesamt 14 Sprachen entwickelte.

Ergebnisse

  • Enge über vierjährige Zusammenarbeit
  • Optische Zeichenerkennung in 14 Sprachen wie Portugiesisch, Polnisch, Niederländisch, Norwegisch, Dänisch, Italienisch, Deutsch, Französisch, Spanisch, Schwedisch, Englisch, Ukrainisch, Russisch und Türkisch.
  • Umfassende Lösung für den gesamten Lebenszyklus des Projekts: Data Annotation, Datenvalidierung und Qualitätssicherung
  • Über 99% Genauigkeit

INHALTSVERZEICHNIS

    Bleiben Sie mit unseren neuesten Updates verbunden, indem Sie unseren Newsletter abonnieren.

      ✔︎ Well done! You're on the list now

      SPRECHEN SIE MIT UNSEREN EXPERTEN ÜBER IHR AI/ML-PROJEKT

      KONTAKTIEREN SIE UNS