Crowds liefern verschiedene Datensätze, um effektive KI zu produzieren
Um den größten Nutzen aus KI zu ziehen, müssen Unternehmen verstehen und sich damit auskennen, was sie kann und was nicht und wie sie für die besten Ergebnisse eingesetzt werden sollte. In diesem Artikel erläutert Jonathan Zaleski, Senior Director of Engineering bei Applaus und Head of Applause Labs, untersucht, wie Unternehmen alle Schwierigkeiten überwinden können, die mit der Implementierung von KI und automatisierten Systemen verbunden sind, und wie wichtig es ist, ihre KI/ML-Modelle erfolgreich zu trainieren und zu testen, um potenziell schädliche Verzerrungen zu beseitigen.
Zweck definieren und Einwände überwinden
Vor der Bereitstellung AI, sollten Unternehmen immer damit beginnen, den Bedarf an der Technologie in ihrer Organisation klar zu definieren und sich zu fragen, welchem Zweck sie dienen wird und wie sie verwendet werden kann, um dieses ursprüngliche Ziel zu erreichen. Es ist auch wichtig festzustellen, wo KI ist nicht erforderlich. Viele Unternehmen verstehen beispielsweise nicht, dass nicht alle ihre Geschäftsprozesse automatisiert werden können – oder müssen. Erst wenn der Zweck definiert ist, kann KI optimal eingesetzt werden.
Jeder KI-Einsatz wird natürlich wahrscheinlich auf Widerstand stoßen. Die uralte Sorge, dass KI eine Bedrohung für die Arbeitsplätze der Menschen darstellt, kann oft überwunden werden, indem die Effizienzvorteile aufgezeigt werden, die die Automatisierung im Vergleich zu zeitaufwändigen, traditionell manuellen Aufgaben bietet. Das Problem der Voreingenommenheit in der KI anzugehen, kann jedoch etwas schwieriger sein.
Das Problem der Voreingenommenheit
Der grundlegende Zweck und die Funktionalität einer KI werden in ihren zugrunde liegenden Algorithmus eingespeist. Wenn die KI jedoch eine inhärente Verzerrung entwickeln würde, hätte dies einen nachteiligen Effekt auf diesen Algorithmus, was die Genauigkeit und Effizienz, die von der KI erwartet werden, ernsthaft beeinträchtigen könnte. Dies wiederum kann seine Fähigkeit einschränken, seine kommerziellen Anforderungen zu erfüllen, und das kann schlecht für das Geschäft sein.
Trotz der besten Absichten der Entwickler kann Voreingenommenheit leider immer einen Weg finden, einen KI-Algorithmus zu durchdringen. Vorurteile, die auf Geschäftsentscheidungen, Trainingsdaten und sogar bewussten Vorurteilen beruhen, tauchen immer wieder auf. Und solche Verzerrungen können nicht nur die Effizienz beeinträchtigen, sondern auch die Wahrnehmung einer Marke negativ beeinflussen. Unbeabsichtigte geschlechtsspezifische Vorurteile führten zum Beispiel dazu Apple-Karte Angebot von niedrigeren Kreditlimits für weibliche Bewerber als für männliche. Die daraus resultierende Gegenreaktion in den sozialen Medien war wenig überraschend hart. Wenn ein Kunde das Gefühl hat, von einem KI-System unfair behandelt zu werden, wird er es sich zweimal überlegen, ob er sich erneut mit dieser bestimmten Marke beschäftigt.
Beispiele wie dieses verstärken nur die Skepsis gegenüber KI und können es Unternehmen erschweren, Investitionen in die Technologie zu rechtfertigen. Um solche Situationen gar nicht erst entstehen zu lassen, sollten Unternehmen daher mehr Wert auf das Training ihrer KI-Algorithmen legen und einen Crowdtesting-Ansatz in Betracht ziehen, um eine entsprechend vielfältige Datenbasis zu gewährleisten.
Praxisnahes Training und Testen
Jeder erfolgreiche KI-Algorithmus basiert auf Trainingsdaten. Aber bei KI wird der Schüler wie bei jedem Lernprozess vom Lehrer beeinflusst. Der Umfang der Ausbildung einer KI ist abhängig vom Lehrplan. Es liegt also nahe, dass ein abwechslungsreicherer und vielfältigerer Lehrplan einen aufgeklärteren Schüler hervorbringen wird. Ebenso wird die Verwendung eines größeren und vielfältigeren Datensatzes dazu beitragen, präzisere und effizientere KI-Algorithmen zu entwickeln, die intelligentere Entscheidungen treffen können und weniger inhärente Vorurteile aufweisen.
Die Beschaffung der Daten, die zur Erfüllung der Anforderungen eines Unternehmens erforderlich sind, kann jedoch eine Herausforderung darstellen, insbesondere für Verbraucheranwendungen und -dienste für den Massenmarkt. Interne Teams aus Entwicklern, Softwareingenieuren und Qualitätssicherungsspezialisten haben in der Regel die gleiche Altersgruppe, das gleiche Geschlecht und den gleichen sozioökonomischen Hintergrund. Infolgedessen kann es beim Sammeln und Kennzeichnen von Daten häufig zu Verzerrungen kommen. Es ist daher am besten, sich beim Erstellen eines KI-Algorithmus nicht auf eine einzelne Person oder kleine Gruppe zu verlassen, um die Daten bereitzustellen, die zum Trainieren dieses Algorithmus verwendet werden. Um es richtig zu trainieren und das Risiko von Verzerrungen zu minimieren, sind verschiedene Arten von Daten und Eingaben erforderlich.
Es wäre weitaus produktiver, Crowdtesting zu verwenden, ein Modell, das den KI-Algorithmus einem vielfältigen Pool von Menschen und Erfahrungen aussetzt, die viel näher an den Kunden sind, für die er entwickelt wurde. Durch die Verwendung dieses Modells können Unternehmen ihre Algorithmen trainieren, um auf reale Szenarien zu reagieren, zu erkennen, wo Verzerrungen auftreten, und ihre potenziellen Auswirkungen zu reduzieren.
Reiche Vielfalt an Daten und Eingaben
Ein KI-Algorithmus muss unter realen Bedingungen getestet werden, indem er mit echten Menschen interagiert, die die Zielgruppe eines Unternehmens nachahmen, um sicherzustellen, dass er wie beabsichtigt funktioniert.
Unternehmen müssen Schulungsdaten aus einem Pool beziehen, der sowohl Qualität und Vielfalt als auch Quantität bietet. Denn ohne Diversität in den Trainingsdaten wird der Algorithmus nicht in der Lage sein, ein besonders breites Spektrum an Möglichkeiten zu erkennen, was seine Effektivität einschränkt. Die notwendige Vielfalt und der Umfang der Daten finden sich in sorgfältig geprüften Gemeinschaften von Testern, die spezifische demografische Daten anbieten – darunter unter anderem Geschlecht, Rasse, Alter, Geografie, Muttersprache, Standort und Fähigkeiten.
Ohne den Zugang zu einer solch reichen Vielfalt an Daten und Eingaben kann die KI ihr Potenzial nicht ausschöpfen, da sie nur auf interne Labortestpraktiken beschränkt ist. Durch die Ergänzung der internen Fähigkeiten einer Organisation zum Trainieren von Algorithmen zum Untersuchen und Erkennen von Stimmen, Text, Bildern und Biometrie kann dieser Crowdtesting-Ansatz Unternehmen starke Ergebnisse liefern, die den Anforderungen eines vielfältigen Kundenstamms gerecht werden.
Seinen Zweck erfüllen
Die KI-Technologie bietet erhebliche Effizienzvorteile für Unternehmen. Es ist jedoch wichtig zu verstehen, wie KI diese Vorteile liefern wird und welche Probleme ihre Effizienz und ihre breitere Akzeptanz behindern könnten.
Unternehmen müssen sich darüber im Klaren sein, dass KI zwar nie perfekt sein wird, aber ständig dazulernt und die besten Maschinenmodelle diejenigen sind, die auf großen und vielfältigen Datensätzen basieren. Ohne Diversität in den Trainingsdaten wird der KI-Algorithmus nicht in der Lage sein, ein breites Spektrum an Möglichkeiten zu erkennen, wodurch die Gefahr besteht, dass er unwirksam wird. Darüber hinaus können inhärente Verzerrungen, die sich aus begrenztem Input ergeben, nicht nur die Effizienz und Präzision der KI beeinträchtigen, sondern auch den Ruf des Unternehmens, das diese KI verwendet.
WEITERLESEN:
- Soziale Gerechtigkeit und Nachhaltigkeit durch Nutzung von Datenwissenschaft und KI: Interview mit Dr. Mahendra Samarawickrama
- Erklärbare KI zur Textzusammenfassung von Rechtsdokumenten
- Es ist Zeit für eine KI-Versicherung
- Warum es ein kommerzieller Imperativ ist, dass Ihr Team KI-Fähigkeiten entwickelt
Die beste Strategie ist daher, einen Crowdtesting-Ansatz zu wählen und diese Trainingsdaten aus einem Pool zu beziehen, der Quantität, Qualität und Vielfalt bietet. Auf diese Weise ist die KI einer Organisation am besten in der Lage, den Zweck zu erfüllen, der ursprünglich vor ihrem Einsatz definiert wurde.