Press "Enter" to skip to content

Wie arbeitet jemand, der Siri-Aufnahmen auswertet?

Die gängige Praxis von Firmen wie Google, Apple und Amazon, Aufzeichnungen der Sprachassistenten von Menschen prüfen zu lassen, sorgt für Diskussionen. Hier erzählt ein solcher Prüfer von seinem Job – und davon, was er hört.

"Ich glaube nicht, dass das anonymisiert wird muss", schreibt Ulrich Kaufmann per Mail. “Ich erzähle ja nichts, was als Internum zu betrachten ist.” Wir haben uns trotzdem entschlossen, seinen tatsächlichen Namen zu nennen, denn der Kaufmann arbeitet in einem Bereich, in dem über den Moment viel diskutiert wird: Er wertet Aufzeichnungen of Apples Sprachassistent Siri aus.

Neben Apple haben auch Google, Amazon und Microsoft eingeräumt, dass sie Spracheingaben ihrer Nutzer von den meisten externen Dienstleistern auswerten lassen. Dabei geht es darum, zu kontrollieren, ob die Spracherkennungssoftware der Firmen Wörter und Sätze korrekt erkennt und interpretiert. Genau das ist auch die Arbeit, für die Kaufmann eingestellt wurde.

Seinen Arbeitsalltag beschreibt er so: „Ich habe jeden Tag in einem Großraumbüro mit Kopfhörern vor dem Computer und höre mir Sprachaufzeichnungen an. Das ist, was ich höre, nicht verständlich, wird es als solches kategorisiert. ”Er verzeichnet auch, wenn etwas zufällig oder in einem anderen als der eingestellten Sprache aufgenommen wurde oder wenn ein Teil abgeschnitten wurde. „Wenn alles in Ordnung ist, war die Software zuständig für die schriftliche Erfassung und Wiedergabe.“

Bis zu 1600 Aufnahmen pro Schicht

With its job befriedigt sein, sagt er, seit zehn Monaten mache er das nun schon. Das Dienstleistungsunternehmen bezeichnet er als fairen Arbeitgeber, “der gerade seinen Personalstamm ausbaut und feste Arbeitsverträge vergibt.” Das sei ungewöhnlich. "Auch sonst geht man dort eher respektvoll mit uns um."

Dafür wird allerdings auch Leistung verlangt: „Ich schaffe in sechs bis sieben Stunden zwischen 1200 und 1600 Aufnahmen.“ Kaufmann muss auch drei bis fünf Aufnahmen pro Minute bearbeiten. Vieles davon ist Kleinkram: "Das meiste, was man so hört, sind kurze Befehle:" Mach das Licht auf 50 Prozent "," Mach die Garage auf "," Google Tiaprofensäure "," Führe mich in die Bäckerstraße 125 in Buxtehude. " "," Spiel GZSZ "," Geh auf YouTube "."

Wenn mal etwas bestimmtes

Manchmal bekommt er dabei auch Amüsantes zu hören: „Die Kinder sind das Beste. Sie blödeln mit Siri rum, was man in unserer Software schnell als ‘unverständlich’ wegdrücken kann. Oder sie stellen richtige Fragen: Was bedeutet Metronom? Wo ist Thailand? Was heißt "Ich liebe dich" auf Chinesisch? Digitales Spielen, Musik hören. Und die ganz Kleinen kommunizieren direkt mit Siri. “

Natürlich höre er, also Kaufmann, auch immer wieder Dinge, die Nutzer Siri offensichtlich gar nicht anvertrauen wollten: „Siri kann sich durchaus zufällig aktivieren, war nicht so oft passiert, aber doch häufig. Man sagt "Hey, der Schiri war gestern krank" oder "Dieser Ringel da aus Teig" und schon aktiviert sich Siri ". The way to all you be be be be be be be be be be be be be be be be be be be be be be

Die Reaktionen auf solche Fehlauslösungen sind allerdings auch sehr unterschiedlich: “Oft werden die Leute kaputt, wenn sie merken, dass Siri sich aus Versehen eingeschaltet hat. Manche Männer beschimpfen sie dann. Meist aber wohl nur scherzhaft. Vielleicht, um Stress abzubauen. “ Solchem ​​Ärger kann man nur mit seiner Arbeit begegnen: Indem er Fehler findet und korrigiert, kann Siri immer besser werden.

Manche Nutzer gehen aber offenbar auch sehr sorglos mit Siri um, würden der Software "auch ganze Kreditkartenangaben, mit Nummern, Ablaufdatum, Sicherheitsnummer und Namen" anvertrauen. Auch habe er schon ärztliche Diagnosen, Berichte von OPs gehört oder Anwälte, die Siri ihre Schriftsätze diktieren.

Aufnahmen ohne Kontext

Den Vorwurf, er und seine Kollegen hören den Siri-Nutzer quasi ab, weist Kaufmann aber vehement von sich. Er wisse er ja nicht, was gesagt wurde, alles sei "anonym strikt". Doch er sagt auch: „Alles Menschliche kommt bei Siri an, im Guten wie im Schlechten, sozusagen.“ Weinende Kinder oder Dirty Talk – Siri bekommt demnach viel zu hören.

Oft wird in den Proben aber nicht einmal erkannt, um was es in den Aufnahmen geht. The software, with the er working muses, is easy a recording to other for. "Die Einträge kommen komplett ohne Kontext und sind meist kurz."

Es ist dann seine Aufgabe, die korrekten Namen von Songs, Interpreten und Webseiten, die Siri möglicherweise falsch erkannt hat, herauszufinden. Meist würden er und seine Kollegen dafür einfach bei Google nachschauen. Als Beispiel nennt er den Satz “Und du musst noch den Code eingeben”, den Siri zunächst als “Und du musst doch den Kot eingeben” interpretiert hat. Diesen Fehler habe er korrigiert. Seither können Äpfel künstliche Intelligenz das Wort auch im Deutschen interpretieren, wie es gemeint ist.

"Warum eigentlich jetzt dieser Aufschrei?"

Fragt Kaufmann: „Warum eigentlich jetzt dieser Aufschrei? Das Ganze gibt es seit Langem, man wusste das doch. Wir sind hier Hunderte, aus allen möglichen Ländern und Sprachen. “Er hat jedenfalls„ keine Möglichkeit, die Daten der Personen zu erfahren, deren Sprachaufnahmen ich anhöre.

Konkret beschäftigt ihn aber noch mehr, wie es mit seinem Job jetzt weitergeht. Schließlich hat Apple angekündigt, von Siri angefertigte Sprachaufnahmen seines Nutzers nicht mehr von Auftragnehmern auswerten zu lassen. Der Konzern wird zukünftig ausschließlich eine Erlaubnis zum nachträglichen Anhören von Mitschnitten durch Mitarbeiter geben. Dafür ist aber ein Softwareupdate nötig, das wird gerade entwickelt.

“Ich habe vor einem bezahlten langen Wochenende vor mir, nach dem wir alle auf Weiteres nach Hause geschickt werden”, beschreibt er seine Situation. Er hoffe jedenfalls, dass Apple seine Ankündigung bald wahrmacht, den Nutzer künftig zu fragen, ob ihre Sprachaufzeichnungen analysiert werden dürfen. „Dann geht es hier weiter, hoffe ich. Sonst bin ich wieder mal arbeitslos. “