Überwindung der Vorurteile: Ein Daten- oder ein Menschenproblem
„Daten“ und „Fakten“ sind austauschbare Begriffe, richtig? Leider nicht. Eine echte Herausforderung bei Daten kann sein, wie sie interpretiert werden und welche Verzerrungen sie enthalten können.
Voreingenommenheit ist ein menschliches Problem, aber es kann Daten in großem Maße beeinflussen. Voreingenommenheit ist eine natürliche Komponente des menschlichen Denkprozesses und kann als solche von Natur aus in Daten und die Geschichten, die sie erzählen, eingebettet sein. Datenmuster und Algorithmen werden von Menschen erstellt und ahmen daher häufig menschliches Verhalten nach. Aus diesem Grund ist die Tatsache Fast alle großen Datensätze, die von Systemen generiert werden, die auf ML/KI-basierten Modellen basieren, sind anfällig für Verzerrungen.
Es gibt viele nachteilige Auswirkungen von Voreingenommenheit in der Datenanalyse, von schlechten Entscheidungen, die sich direkt auf das Endergebnis eines Unternehmens auswirken, bis hin zu dem Potenzial, rassische, politische oder geschlechtsspezifische Ungleichheiten zu verstärken (oder sogar zu beschleunigen) und ein irreführendes und verzerrtes Bild der Fakten zu zeichnen auf dem Boden. Obwohl Daten uns helfen, die Welt wie nie zuvor zu sehen, ist es ein wichtiger Schritt, um bessere Entscheidungen mit Daten zu treffen, sich bewusst zu werden und vorbeugende Maßnahmen gegen Datenverzerrungen zu ergreifen.
Die Vermeidung von Voreingenommenheit beginnt mit der Erkenntnis, dass Datenvoreingenommenheit besteht, und der Schlüssel ist, skeptisch zu sein und alles zu hinterfragen: Wer hat die Daten erstellt? Warum haben sie die Daten erstellt? Wie wurden die Daten erstellt? In seinem neuesten Artikel wirft Simon einen Blick auf die verschiedenen Arten von Verzerrungen in der Datenanalyse und wie Modellierer Verzerrungen beheben können, bevor Probleme auftreten.
- Arten von Verzerrungen in der Datenanalyse
- Grundursachen von Datenverzerrungen
- Die Auswirkungen voreingenommener Daten
- Voreingenommenheit überwinden und intelligentere Datenentscheidungen treffen