Zum Inhalt springen

Big Data

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 11. November 2025 um 13:16 Uhr durch imported>17387349L8764 (HC: Ergänze Kategorie:Digitale Transformation).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Datei:Viegas-UserActivityonWikipedia.gif
Farbliche Darstellung der Aktivität eines Wikipedia-Bots über einen längeren Zeitraum: typisches Beispiel der Veranschaulichung von Big Data mit einer Visualisierung

Der aus dem englischen Sprachraum stammende Begriff Big Data [<templatestyles src="IPA/styles.css" />ˈbɪɡ ˈdeɪtə] (von {{Modul:Vorlage:lang}} Modul:Vorlage:lang:103: attempt to index field 'wikibase' (a nil value) ‚groß‘ und {{Modul:Vorlage:lang}} Modul:Multilingual:153: attempt to index field 'data' (a nil value) ‚Daten‘, deutsch auch Massendaten) steht in engem Zusammenhang mit dem umfassenden Prozess der Datafizierung und bezeichnet Datenmengen, welche zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten.<ref>W. Christl: Kommerzielle digitale Überwachung im Alltag. PDF, auf: crackedlabs.org, November 2014, S. 12.</ref>

Big Data wird häufig als Sammelbegriff für digitale Technologien verwendet, die in technischer Hinsicht für eine neue Ära digitaler Kommunikation und Verarbeitung und in sozialer Hinsicht für einen gesellschaftlichen Umbruch verantwortlich gemacht werden.<ref>R. Reichert: Big Data: Analysen zum digitalen Wandel von Wissen, Macht und Ökonomie. transcript Verlag, Bielefeld 2014, S. 9.</ref> Dabei unterliegt der Begriff als Schlagwort einem kontinuierlichen Wandel; so wird damit ergänzend auch oft der Komplex der Technologien beschrieben, die zum Sammeln und Auswerten dieser Datenmengen verwendet werden.<ref name="President BG14">President’s Council of Advisors for Science and Technology: Big Data: Seizing Opportunities, Preserving Values, Executive Office of the President, Mai 2014.</ref><ref>Edd Dumbill: <templatestyles src="Webarchiv/styles.css" />What is big data? An introduction to the big data landscape. (Memento vom 23. April 2014 im Internet Archive) auf: strata.oreilly.com, 11. Januar 2012.</ref>

Begriff

In der Definition von Big Data bezieht sich das „Big“ auf die vier Dimensionen

  • volume (Umfang, Datenvolumen),
  • velocity (Geschwindigkeit, mit der die Datenmengen generiert und transferiert werden),
  • variety (Bandbreite der Datentypen und -quellen)<ref>Gartner IT Glossary: „Big data is high-volume, high-velocity and high-variety in formation assets that demand cost- effective, innovative forms of information processing for enhanced insight and decision making“. Abgerufen am 15. Januar 2016 von: http://www.gartner.com/it-glossary/big-data</ref> sowie
  • veracity (Echtheit von Daten).

Erweitert wird diese Definition um die zwei Vs value (Wert) und validity (Richtigkeit), welche für einen unternehmerischen Mehrwert und die Sicherstellung der Datenqualität stehen.<ref>R. Bachmann, T. Gerzer, D. G. Kemper: Big Data – Fluch oder Segen? – Unternehmen im Spiegel gesellschaftlichen Wandels. Mitp Verlag, Heidelberg / München / Landsberg / Frechen / Hamburg 2014, S. 23ff, 2014, S. 27ff.</ref>

Weitere Bedeutungen

Big Data bezeichnet primär die Verarbeitung von großen, komplexen und sich schnell ändernden Datenmengen. Als Buzzword bezeichnet der Begriff in den Massenmedien aber andere Bedeutungen:

  • Überwachung der Menschen durch Geheimdienste auch in westlichen Staaten bspw. durch Vorratsdatenspeicherung
  • Verletzung von Persönlichkeitsrechten von Kunden durch Unternehmen
  • Zunehmende Intransparenz der Datenspeicherung durch Delokalisierung (Cloud Computing)
  • Wunsch der Industrie aus den vorhandenen Daten einen Wettbewerbsvorteil erlangen zu können
  • Automatisierung von Produktionsprozessen (Industrie 4.0, Internet der Dinge)
  • Intransparente Automatisierung von Entscheidungsprozessen in Software<ref>Stefan Schulz: Wir und unsere virtuellen Zombies. In: FAZ. 15. September 2014, abgerufen am 19. Februar 2015.</ref><ref name="Der Angriff der Intelligenz">Götz Hamann, Adam Soboczynski: Der Angriff der Intelligenz. In: Die Zeit. 10. September 2014, abgerufen am 19. Februar 2015.</ref>
  • Einsatz neuer Technologien statt Standardsoftware (insbesondere in Unternehmen mit einer konservativen IT oft durch Verwendung von Software as a Service um firmeninterne IT-Einschränkungen zu umgehen)
  • Entwicklung von eigenen Softwarelösungen („inhouse IT“) statt des Einsatzes von „off-the-shelf“ Software durch Fremdunternehmen
  • Werbung, basierend auf Daten über die Internet- und Handynutzung
  • Organisation von Zusammenarbeit im Rahmen von People Analytics Projekten, selbst wenn in diesem Zuge teilweise weder große noch komplexe Datenmengen anfallen.<ref name="small-data-meinen" />

Datenherkunft

Die gesammelten Daten können dabei aus verschiedensten Quellen stammen (Auswahl):

Big Data umfasst auch Bereiche, die als intim bzw. privat gelten: Der Wunsch der Industrie und bestimmter Behörden, möglichst freien Zugriff auf diese Daten zu erhalten, sie besser analysieren zu können und die gewonnenen Erkenntnisse zu nutzen, gerät dabei unweigerlich in Konflikt mit geschützten Persönlichkeitsrechten der Einzelnen. Ein Ausweg ist allein durch eine Anonymisierung der Daten zu erreichen. Klassische Anwender sind Provider sozialer Netzwerke und von Suchmaschinen. Die Analyse, Erfassung und Verarbeitung von großen Datenmengen ist heute in vielen Bereichen alltäglich.

Big Data kann Geschäftsprozessverbesserungen in allen Funktionsbereichen von Unternehmen, vor allem aber im Bereich der Technologieentwicklung und Informationstechnik sowie des Marketings ermöglichen.<ref>Rainer Schmidt, Michael Möhring, Stefan Maier, Julia Pietsch, Ralf-Christian Härting: Big Data as Strategic Enabler – Insights from Central European Enterprises. In: Business Information Systems (= Lecture Notes in Business Information Processing. Band 176). Springer International Publishing, 2014, ISBN 978-3-319-06694-3, S. 50–60, doi:10.1007/978-3-319-06695-0_5.</ref> Die Erhebung und Verwertung der Datenmengen dient dabei im Allgemeinen der Umsetzung von Unternehmenszielen oder zur staatlichen Sicherheit. Bisher haben vor allem große Branchen, Unternehmen und Anwendungsbereiche der Wirtschaft, Marktforschung, Vertriebs- und Servicesteuerung, Medizin, Verwaltung und Nachrichtendienste die entsprechenden digitalen Methoden für sich genutzt: Die erfassten Daten sollen weiterentwickelt und nutzbringend eingesetzt werden. Die Erhebung der Daten dient dabei meistens für konzernorientierte Geschäftsmodelle sowie Trendforschung in den sozialen Medien und Werbeanalysen, um zukunftsweisende und möglicherweise gewinnbringende Entwicklungen zu erkennen und in Prognosen umzumünzen.<ref>Kommerzielle digitale Überwachung im Alltag. (PDF; 1,6 MB) auf: crackedlabs.org. S. 12 ff.</ref>

Wachstum

Mengen von Daten wachsen typischerweise exponentiell. Berechnungen aus dem Jahr 2011 zufolge verdoppelt sich das weltweite erzeugte Datenvolumen alle 2 Jahre.<ref>Klaus Manhart: <templatestyles src="Webarchiv/styles.css" />Vorlage:Webarchiv/Wartung/TodayDer Wert des Parameters archive-today muss ein Datum der Form YYYYMMDD oder Zeitstempel der Form YYYY.MM.DD-hhmmss bzw. YYYYMMDDhhmmss sein. In: CIO. 12. Juli 2011.</ref> Diese Entwicklung wird vor allem getrieben durch die zunehmende maschinelle Erzeugung von Daten z. B. über Protokolle von Telekommunikationsverbindungen (Call Detail Record, CDR) und Webzugriffen (Logdateien), automatische Erfassungen von RFID-Lesern, Kameras, Mikrofonen und sonstigen Sensoren. Big Data fällt auch in der Finanzindustrie an (Finanztransaktionen, Börsendaten) sowie im Energiesektor (Verbrauchsdaten) und im Gesundheitswesen (Abrechnungsdaten der Krankenkassen). In der Wissenschaft fallen ebenfalls große Datenmengen an, z. B. in der Geologie, Genetik, Klimaforschung und Kernphysik. Der IT-Branchenverband Bitkom hat Big Data als einen Trend im Jahr 2012 bezeichnet.<ref>Trendkongress: Big Data, wenig Schutz. Abgerufen am 27. November 2012.</ref> Bei großen Datenkomplexen verbietet sich der unwirtschaftliche Aufwand für ein Speichern auf Vorrat. Dann werden lediglich Metadaten gespeichert oder das Auswerten setzt mitlaufend oder höchstens gering zeitversetzt mit dem Entstehen der Daten auf.

Zugang zu einem entsprechenden Datenvolumen haben die entsprechenden Konzerne, etwa Suchmaschinen, und bestimmte staatliche Institutionen, etwa Geheimdienste.<ref>Siehe beispielsweise Armin Grunwald im Interview: Gefahren der Digitalisierung: „Die Leute merken nicht mehr, wie fragil das System ist“. In: sueddeutsche.de. 29. Januar 2018, abgerufen am 30. Januar 2018.</ref>

Beispiele

In der Forschung können durch Verknüpfung großer Datenmengen und statistische Auswertungen neue Erkenntnisse gewonnen werden, insbesondere in Disziplinen, in denen bisher viele Daten noch von Hand ausgewertet wurden. Unternehmen erhoffen sich von der Analyse von Big Data Möglichkeiten zur Erlangung von Wettbewerbsvorteilen, zur Generierung von Einsparungspotentialen und zur Schaffung neuer Geschäftsfelder. Staatliche Stellen erhoffen sich dagegen bessere Ergebnisse in der Kriminalistik und Terrorismusbekämpfung.<ref>Hilton Collins: Predicting Crime Using Analytics and Big Data. 24. Mai 2014, abgerufen am 23. Januar 2014.</ref> Beispiele für erwartete Vorteile sind:

Die reine Analyse von Kundendaten ist jedoch noch nicht automatisch Big Data – oft handelt es sich bei vielen Anwendungen aus dem Marketing viel mehr um Small-Data-Analytics.<ref name="small-data-meinen">Fergus Gloster: Von Big Data reden aber Small Data meinen. Computerwoche, 1. Oktober 2014, abgerufen am 5. Oktober 2014.</ref>

Verarbeitung von Big Data

Klassische relationale Datenbanksysteme sowie Statistik- und Visualisierungsprogramme sind oft nicht in der Lage, derart große Datenmengen zu verarbeiten. Für Big Data kommen daher neue Arten von Datenspeicher- und Analyse-Systemen zum Einsatz, die parallel auf bis zu Hunderten oder Tausenden von Prozessoren beziehungsweise Servern arbeiten, wie zum Beispiel in kognitiven Systemen. Dabei gibt es unter anderem folgende Probleme:

  • Verarbeitung vieler Datensätze
  • Verarbeitung vieler Spalten innerhalb eines Datensatzes
  • Schneller Import großer Datenmengen
  • Sofortige Abfrage importierter Daten (Realtime Processing)
  • Kurze Antwortzeiten (Latenz und Verarbeitungsdauer) auch bei komplexen Abfragen
  • Möglichkeit zur Verarbeitung vieler gleichzeitiger Abfragen (Concurrent Queries)
  • Analyse verschiedenartiger Informationstypen (Zahlen, Texte, Bilder, …)

Die Entwicklung von Software für die Verarbeitung von Big Data befindet sich noch in einer frühen Phase. Bekannt ist der MapReduce-Ansatz, der bei Open-Source-Software (Apache Hadoop und MongoDB) sowie bei einigen kommerziellen Produkten (unter anderem Aster Data oder Greenplum) zum Einsatz kommt.<ref>Michael Gottwald: Was ist Big Data? - Big Data Analytics, Software, Tools + Trends. Abgerufen am 22. November 2022.</ref>

Anwendung (Auswahl)

Politische Wahlen

Bei der Präsidentschaftswahl in den Vereinigten Staaten 2016 sowie bei dem Volksentscheid in Großbritannien über den Austritt aus der Europäischen Union im selben Jahr (Brexit) hatten die überraschenden Gewinner jeweils das Unternehmen Cambridge Analytica engagiert, die sich mit der Erhebung, Auswertung, Anwendung und Zuordnung sowie mit dem Verkauf hauptsächlich im Internet gewonnener persönlicher Daten beschäftigt und Methoden der Psychometrie anwendet, einem Ableger der Psychologie.<ref name="dasmagazin.ch 48 3-12-016 Grassegger Krogerus">Hannes Grassegger, Mikael Krogerus: Ich habe nur gezeigt, dass es die Bombe gibt. auf: dasmagazin.ch, 48., 3. Dezember 2016, abgerufen am 10. Dezember 2016.</ref><ref name="deutschlandfunk.de Computer & Kommunikation 10-12-016 Peter Welchering">Peter Welchering: Politik 4.0: Online-Manipulation der Wähler. auf: deutschlandfunk.de, Computer und Kommunikation, 10. Dezember 2016.</ref>

Social Scoring

Gesammelte Daten werden zur Bewertung z. B. der Kreditwürdigkeit (-> Kreditscoring), der Gesundheit (und entsprechender Risiken, woraus z. B. auch die Gestaltung entsprechend angepasster Versicherungsprämien folgt) oder des Konsum- und Einkaufsverhaltens von Verbrauchern herangezogen, auch zum Versuch entsprechender Voraussagen (Predicting); in China baut auf ihnen das Social Scoring-System auf, mit dem auch das soziale Verhalten der Einwohner kontrolliert und bewertet wird und verbessert werden soll.<ref>Verbraucher-Scoring – "Viele wissen nicht, dass sie ständig bewertet werden". In: Deutschlandfunk. (deutschlandfunk.de [abgerufen am 1. November 2018]).</ref><ref>Yuval Noah Harari: Why Technology Favors Tyranny. In: The Atlantic. Oktober 2018, ISSN 1072-7825 (theatlantic.com [abgerufen am 11. März 2019]).</ref>

Bildungswesen

Der Einsatz von Big Data eröffnet für das Bildungswesen neue Möglichkeiten. Die Technik kann zur Optimierung von Lernformen und Bildungsprogrammen genutzt werden.<ref>Ben Bergen: Big Data im Schulunterricht. (PDF) Archiviert vom Vorlage:IconExternal am 19. November 2018; abgerufen am 19. November 2018.</ref> Experten wie Viktor Mayer-Schönberger und Kenneth Cukier rechnen mit einem grundlegenden Umbruch des Bildungssektors durch den Einsatz von Big Data.<ref>Cukier, Kenneth; Viktor Mayer-Schönberger: Lernen mit Big Data : Die Zukunft der Bildung. 1. Auflage. REDLINE-Verl, München 2014, ISBN 3-86881-225-3.</ref>

Forschung

Durch die Fortschritte in der Datenverarbeitung können anhand großer Datenmenge wesentlich zuverlässigere Ergebnisse erzielt werden. Beispiele sind eine Studie mit rund 16.000 Kindern, in der Zusammenhänge zwischen Übergewicht und Diabetes untersucht wurden,<ref>Übergewicht und Diabetes: Frühe Zucker-Prägung hält wohl ein Leben lang, Ärzte Zeitung online, 9. November 2018.</ref> und eine Fall-Kontroll-Studie zum Einfluss von Fluglärm, bei der die Krankenkassendaten von über einer Million Patienten ausgewertet wurden.<ref>Risikofaktor nächtlicher Fluglärm – Abschlussbericht über eine Fall-Kontroll-Studie zu kardiovaskulären und psychischen Erkrankungen im Umfeld des Flughafens Köln-Bonn</ref>

Microtargeting

Die Firma Cambridge Analytica ließ nach der US-Präsidentschaftswahl 2016 verlauten, dass der Einsatz sogenannter Microtargeting-Techniken entscheidend zum Wahlsieg von Donald Trump beigetragen haben soll.<ref name=":0">Fabian Prietzel: Big Data is watching you: Persönlichkeitsanalyse und Microtargeting auf Social Media. In: Markus Appel (Hrsg.): Die Psychologie des Postfaktischen: Über Fake News, „Lügenpresse“, Clickbait & Co. Springer, Berlin, Heidelberg 2020, ISBN 978-3-662-58695-2, S. 81–89, doi:10.1007/978-3-662-58695-2_8.</ref> So habe man mittels psychometrischer Analysen von großen Datensätzen unentschiedene beziehungsweise leichter zu beeinflussende Wähler (swing voters) identifizieren und anschließend gezielt via Facebook mit auf sie zugeschnittenen Wahlwerbungen und Inhalten konfrontieren können.<ref name=":0" /> Dem Einsatz besagter Techniken im US-Wahlkampf vorausgegangen waren Forschungsarbeiten des Psychologen Michal Kosinski. Darin verknüpfte Kosinski Big-Data-Auswertungen mit psychologischen Verhaltensanalysen und konnte zeigen, dass sich anhand der Facebook-Likes von Nutzer deren Persönlichkeitseigenschaften, die sexuelle Orientierung, Drogenkonsum sowie die religiöse und politische Einstellung vorhersagen lassen.<ref name=":1">Michal Kosinski, David Stillwell, Thore Graepel: Private traits and attributes are predictable from digital records of human behavior. In: Proceedings of the National Academy of Sciences. Band 110, Nr. 15, 9. April 2013, ISSN 0027-8424, S. 5802–5805, doi:10.1073/pnas.1218772110, PMID 23479631, PMC 3625324 (freier Volltext) – (pnas.org [abgerufen am 23. März 2020]).</ref>

Kritik

Die US-amerikanische Wirtschaftswissenschaftlerin Shoshana Zuboff prägte im Zusammenhang mit der Sammlung von personenbezogenen Daten durch Internetkonzerne wie Google und Facebook den Begriff Überwachungskapitalismus und sieht darin eine Mutation des Industriekapitalismus, der die private menschliche Erfahrung für frei verfügbares Rohmaterial für die kapitalistische Produktion und den Warenaustausch hält und der die Errungenschaften der Digitalen Revolution zur konspirativen Überwachung, Speicherung, Manipulation und Vorhersage menschlichen Verhaltens nutzt. Zuboff befürwortet die Zerschlagung der derartiger Datenmonopole bildenden Konzerne und Verbote, um die Bildung von Datenkonzentrationen zu beenden.<ref>Shoshana Zuboff: »Es gibt eine unerträgliche Sehnsucht in vielen von uns«. In: Der Spiegel. 29. September 2018 (spiegel.de – Spiegel-Gespräch).; Mirjam Hauck: Facebook, Google & Co.. "Überwachungskapitalisten wissen alles über uns." sz-online, 7. November 2018.</ref>

Wie Forschungsergebnisse unterschiedlicher Wissenschaftler zeigen, lassen sich aus den von Nutzern geteilten Inhalten im Internet zum Teil hoch sensible Informationen extrahieren, die nicht beabsichtigt wurden, geteilt zu werden.<ref name=":1" /><ref>Yilun Wang, Michal Kosinski: Deep neural networks are more accurate than humans at detecting sexual orientation from facial images. In: Journal of Personality and Social Psychology. Band 114, Nr. 2, Februar 2018, ISSN 1939-1315, S. 246–257, doi:10.1037/pspa0000098.</ref><ref>Andrew G Reece, Christopher M Danforth: Instagram photos reveal predictive markers of depression. In: EPJ Data Science. Band 6, Nr. 1, Dezember 2017, ISSN 2193-1127, S. 15, doi:10.1140/epjds/s13688-017-0110-z.</ref> Zum Schutz der digitalen Privatsphäre gewinnen rechtsstaatliche Reglementierungen der Informationsspeicherung und -sammlung daher immer mehr an Relevanz. Doch auch auf Staatsebene werden Big Data zum Teil genutzt, um Informationen über Individuen zusammenzutragen, wie das Sozialkredit-System in China zeigt.<ref>Stefan Krempl: re:publica: US-Forscher hält Chinas Social-Credit-System für Propaganda. 7. Mai 2019, abgerufen am 23. März 2020.</ref>

Datenschutz

Der Datenwissenschaftler Andreas Dewes hat in einer Untersuchung gezeigt, dass anonymisierte Daten von Internetnutzern, die von Firmen gesammelt und verkauft wurden, wieder entschlüsselt und Personen zugeordnet werden können. Aus den von Dewes im Rahmen seiner Untersuchung von Werbefirmen gekauften, angeblich „anonymen“ Daten von ca. drei Millionen Deutschen waren Mitglieder des Deutschen Bundestags und von Landesparlamenten sowie weitere Personen des öffentlichen Lebens wie Richter, Polizeibeamte oder andere Funktionäre.<ref>deutschlandfunk.de, Interview, 28. Januar 2017, Andreas Dewes im Gespräch mit Stephanie Rohde: Es wird immer schwieriger, sich zu schützen (28. Januar 2017)</ref>

Der Europäische Datenschutzbeauftragte Giovanni Buttarelli betonte im März 2013, persönliche Informationen seien keine Ware.<ref>netzpolitik.org</ref>

Mit Bezug auf die Versicherungsbeitragsanpassung mittels Big Data wird unter anderem die „Gefahr einer schleichenden Entsolidarisierung in der Versicherung“ hervorgehoben.<ref>Zwischen Verheissung und Bedrohung – Big Data in der Versicherungswirtschaft. (PDF) In: Die Volkswirtschaft, Das Magazin für Wirtschaftspolitik 5-2014. Staatssekretariat für Wirtschaft (SECO) und Eidgenössisches Departement für Wirtschaft, Bildung und Forschung (WBF), Mai 2014, abgerufen am 1. Oktober 2016. S. 25.</ref>

Unzureichende Regulierung

Eine entscheidende Frage ist, wem die von Privatpersonen gesammelten Daten gehören, wer die Verfügungshoheit über sie behält und wer ihre Nutzung kontrolliert. Inwieweit die europäische Datenschutz-Grundverordnung, die seit 25. Mai 2018 anzuwenden ist, ausreicht, wird in der Öffentlichkeit diskutiert.

Der schleswig-holsteinische Datenschutzbeauftragte Thilo Weichert warnte 2013: „Big Data eröffnet Möglichkeiten des informationellen Machtmissbrauchs durch Manipulation, Diskriminierung und informationelle ökonomische Ausbeutung – verbunden mit der Verletzung der Grundrechte der Menschen.“<ref>Weichert fordert Hinterfragung und Erforschung von „Big Data“. 18. März 2013, archiviert vom Vorlage:IconExternal (nicht mehr online verfügbar) am 2. Dezember 2013; abgerufen am 21. März 2013.</ref><ref>Big Data: Sowohl Gefahr für die Demokratie als auch ökonomische Chance. 20. März 2013, abgerufen am 21. März 2013.</ref>

Dirk Helbing, Professor für Computational Social Science an der ETH Zurich, warnte im Januar 2018 vor möglichen Technologien subtiler Manipulation auf Basis von Big Data.<ref>Dirk Helbing: Big Nudging – zur Problemlösung wenig geeignet. In: Spektrum.de. 12. November 2015, abgerufen am 30. Januar 2018.</ref> Der Technikfolgenabschätzer Armin Grunwald, Leiter des Institut für Technikfolgenabschätzung und Systemanalyse (ITAS) in Karlsruhe, warnt, es habe zu keiner Zeit in der Menschheitsgeschichte „derart gute Bedingungen für eine totalitäre Diktatur“ gegeben wie heute.<ref>Armin Grunwald im Interview: Gefahren der Digitalisierung: „Die Leute merken nicht mehr, wie fragil das System ist“. In: sueddeutsche.de. 29. Januar 2018, abgerufen am 30. Januar 2018.</ref>

Der Sozialforscher Nils Zurawski plädiert für eine "solidarische Datenspeicherung", um die Vorteile von Big Data für das Gemeinwohl nutzen zu können.<ref>Big Data fürs Gemeinwohl – Her mit der Daten-Genossenschaft! Ein Vorschlag von Nils Zurawski. Deutschlandfunk Kultur, 20. Februar 2019, abgerufen am 21. August 2019.</ref>

Mangelhafte Grundlage für Auswertungen

Kritik gibt es vor allem daran, dass die Datenerhebung und -auswertung praktisch ausschließlich nach technischen Aspekten erfolgt und beispielsweise der technisch einfachste Weg gewählt wird, die Daten zu erheben. Statistische Grundprinzipien wie das einer repräsentativen Stichprobe werden oft vernachlässigt. So kritisierte die Sozialforscherin Danah Boyd:<ref name="danah">Danah Boyd: Privacy and Publicity in the Context of Big Data. In: WWW 2010 conference. 29. April 2010, abgerufen am 18. April 2011 (Lua-Fehler in Modul:Multilingual, Zeile 153: attempt to index field 'data' (a nil value), Keynote WWW 2010).</ref>

  • Größere Datenmengen müssten nicht qualitativ bessere Daten sein
  • Nicht alle Daten seien gleichermaßen wertvoll
  • „Was“ und „Warum“ seien zwei unterschiedliche Fragen
  • Bei Interpretationen sei Vorsicht geboten
  • Nur weil es verfügbar ist, sei es nicht ethisch vertretbar.

Ein Forscher ermittelte beispielsweise, dass Menschen nicht mehr als 150 Freundschaften pflegen (Dunbar-Zahl), was sodann als technische Begrenzung in sozialen Netzwerken eingeführt wurde – in der falschen Annahme, als „Freunde“ bezeichnete Bekanntschaften würden echte Freundschaften widerspiegeln.<ref name="danah" /><ref>Marco Metzler: Die Mechanismen virtueller Beziehungsnetze. In: Neue Zürcher Zeitung. 16. November 2007.</ref> Sicherlich würde nicht jeder alle seine Facebook-Freunde in einem Interview als Freunde benennen – der Begriff eines „Freundes“ signalisiert bei Facebook lediglich eine Kommunikationsbereitschaft.

Ein anderer kritischer Ansatz setzt sich mit der Frage auseinander, ob Big Data das Ende aller Theorie bedeutet. Chris Anderson, Chefredakteur beim Magazin Wired beschrieb 2008 das Glaubwürdigkeitsproblem jeder wissenschaftlichen Hypothese und jedes Modells bei gleichzeitiger Echtzeitanalyse lebender und nicht lebender Systeme. Korrelationen werden wichtiger als kausale Erklärungsansätze, die sich oft erst später bewahrheiten oder falsifizieren lassen.<ref>Siehe auch: Chris Anderson in WIRED und cum hoc ergo propter hoc</ref>

Hype, Schwammiger Begriff

Der Begriff „Big Data“ wird gelegentlich auch dann verwendet, wenn Daten weder groß noch komplex sind oder sich nicht schnell ändern oder mit herkömmlichen Techniken problemlos verarbeitet werden können.<ref name="small-data-meinen" /> Die zunehmende Aufweichung des Begriffs führt nach Meinung einiger Beobachter dazu, dass er immer mehr ein aussageloser Marketingbegriff werde und vielen Prognosen zufolge innerhalb der nächsten Jahre eine starke Abwertung erfahre („Tal der Enttäuschungen“ im Hype-Zyklus).

Siehe auch

Literatur

Sachbücher

  • Ronald Bachmann, Guido Kemper, Thomas Gerzer: Big Data – Fluch oder Segen? Unternehmen im Spiegel gesellschaftlichen Wandels. Mitp, Heidelberg / München / Landsberg / Frechen / Hamburg 2014, ISBN 978-3-8266-9690-9.
  • Pavlo Baron: Big data für IT-Entscheider – riesige Datenmengen und moderne Technologien gewinnbringend nutzen. Hanser, München 2013, ISBN 978-3-446-43339-7.
  • Konrad Becker u. a.: Die Politik der Infosphäre. Springer Fachmedien, Wiesbaden 2003, ISBN 3-8100-3866-0.
  • Heinrich Geiselberger, Tobias Moorstedt (Redaktion): Big Data. Das neue Versprechen der Allwissenheit. edition unseld SV Sonderdruck. 2. Auflage. Suhrkamp, Berlin 2013, ISBN 978-3-518-06453-5.
  • Yvonne Hofstetter: Sie wissen alles – Wie intelligente Maschinen in unser Leben eindringen und warum wir für unsere Freiheit kämpfen müssen. C. Bertelsmann Verlag, 2014, ISBN 978-3-570-10216-9.<ref name="Der Angriff der Intelligenz" /><ref>Stefan Schulz: Sie wissen alles. In: FAZ. 15. September 2014, abgerufen am 19. Februar 2015.</ref><ref>Vera Linß: Sachbuch über Big Data – Gefährliche Datenfusion, Deutschlandradio Kultur, 15. September 2014, abgerufen am 19. Februar 2015.</ref>
  • Rudolf Klausnitzer: Das Ende des Zufalls, wie Big Data uns und unser Leben vorhersagbar macht. Ecowin, Salzburg 2013, ISBN 978-3-7110-0040-8.
  • Barbara Kolany-Raiser, Reinhard Heil, Carsten Orwat, Thomas Hoeren (Hrsg.): Big Data und Gesellschaft. Eine multidisziplinäre Annäherung. Springer VS, Wiesbaden 2018, ISBN 978-3-658-21664-1 (Softcover), ISBN 978-3-658-21665-8 (E-Book), doi:10.1007/978-3-658-21665-8.
  • Jaron Lanier: Wem gehört die Zukunft? „Du bist nicht der Kunde der Internetkonzerne. Du bist ihr Produkt“. Hoffmann & Campe, 2014, ISBN 978-3-455-50318-0.
  • Klaus Mainzer: Die Berechnung der Welt: von der Weltformel zu Big Data. Beck, München 2014, ISBN 978-3-406-66130-3.
  • Mario Martini: Big Data als Herausforderung für den Persönlichkeitsschutz und das Datenschutzrecht. DVBl. 2014, S. 1481–1489.
  • Viktor Mayer-Schönberger, Kenneth Cukier: Big Data: die Revolution, die unser Leben verändern wird. Redline, München 2013, ISBN 978-3-86881-506-1, (aus dem Englischen von Dagmar Mallett).
  • Ramón Reichert (Hrsg.): Big Data: Analysen zum digitalen Wandel von Wissen, Macht und Ökonomie. transcript Verlag, Bielefeld 2014, ISBN 978-3-8376-2592-9.
  • Gregor Ritschel, Thomas Müller (Redaktion): Themenschwerpunkt Big Data als Theorieersatz. In: Berliner Debatte Initial, Heft 4/2016, ISBN 978-3-945878-11-8.
  • Arno Rolf: Weltmacht Vereinigte Daten. Die Digitalisierung und Big Data verstehen, Metropolis-Verlag, Marburg 2018, ISBN 978-3-7316-1314-5.
  • Christian Rudder: Inside Big Data – Unsere Daten zeigen, wer wir wirklich sind. Aus dem Englischen von Kathleen Mallett. Hanser-Verlag, 2016, ISBN 978-3-446-44459-1.<ref>Michael Lange: Das wahre „Ich“ des Menschen, DeutschlandfunkWissenschaft im Brennpunkt. 20. März 2016.</ref>
  • Torsten Schwarz (Hrsg.): Big Data im Marketing: Chancen und Möglichkeiten für eine effektive Kundenansprache. Haufe, Freiburg 2015, ISBN 978-3-648-06585-3.
  • Shoshana Zuboff: Das Zeitalter des Überwachungskapitalismus, Campus Verlag, 2018, ISBN 978-3-593-50930-3.

Forschungsberichte

Belletristik

  • Eugen Ruge: Follower – Vierzehn Sätze über einen fiktiven Enkel. Roman. Rowohlt 2016, ISBN 978-3-498-05805-0.

Weblinks

Commons: Big Data – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

<references responsive />

Vorlage:Hinweisbaustein