Künstliche Intelligenz killt das Web

Das Netz quillt vor KI-generiertem Müll über. Ist das Internet noch zu retten?

Quelle: Künstliche Intelligenz killt das Web - taz.de • Autor: Adrian Lobe
Themen: Internet (-angebote/-nutzung/-kultur) KO05Konsum / Konsumverhalten LE08
Hören: DLF Fazit. Die komplette Sendung, ab 42:31, Kulturpresseschau von Arno Orzessek.

taz. die tageszeitung. • 28. 3. 2024 • Ausgabe 13343 • Seite 14 • 7460 Zeichen • ca. 249 Zeilen.

Wenn man im Internet oder dem, was von der Utopie einer Cyberagora übrig geblieben ist, surft, hat man das Gefühl, durch eine hyperkommerzialisierte, gigantische Shopping-Mall zu laufen: Am Eingang wird man von einem Nacktscanner durchleuchtet, und wenn man ein Geschäft betritt, wird man auf Schritt und Tritt von einem übergriffigen Kaufhausdetektiv verfolgt, der einem in die Taschen und Einkaufswägen glotzt. Auf dem Amazon-Marktplatz drehen Computeralgorithmen sekündlich an der Preisschraube, hinter den Schaufenstern der Facebook-Filiale Instagram präsentieren Influencer die neueste Mode, und in der schummrigen Trinkhalle der Plattform X krakeelen rechte Scharfmacher herum, nachdem der neue Hauseigentümer im Maschinenraum das Ventil für Hass und Hetze geöffnet hat.

Die kleinen inhabergeführten Bars, Cafés und Buchhandlungen sind verschwunden und der Datenhygiene der Tech-Giganten zum Opfer gefallen, die nach dem Vorbild von Baron Haussmann eine Flurbereinigung durchführen ließen. Nichts soll anrüchig oder unsicher wirken, alles soll blitzblank poliert und sicher sein. Wie in einer Gated Community. Trotz dieser Hygienemaßnahmen stolpert der Besucher an jeder Ecke über Abfall.

Man muss diese Analogie bei netzpolitischen Debatten im Hinterkopf behalten. Seit dem Siegeszug von ChatGPT quillt das Internet vor Müll über: Amazon wird mit KI-generierter Schrottliteratur überschwemmt, die Plattform X mit KI-generierten Pornobildern vollgespammt, Spotify mit KI-generierten Songs geflutet, die teils sogar von Bots gestreamt werden, um die Klickzahlen in die Höhe zu schrauben. Digitaler Kapitalismus am Limit.

War das Internet eine Revolution der Publikation, ist KI eine Revolution der Produktion. Mit frei zugänglichen KI-Werkzeugen kann heute jeder zum Buchautor werden. Einfach ein Manuskript aus dem Automaten herauslassen, ein Cover prompten, fertig ist das E-Book. Wer braucht noch Autoren oder Lektoren, wenn es KI gibt? Was vormals in mühevoller Manufakturarbeit hergestellt wurde, ist heute seriell produzierte Massenware.

Die US-Zeitschrift Sports Illu­strated etwa hat mithilfe von KI nicht nur Texte produziert, sondern auch Autoren erfunden. Vollautomatisierte Webseiten, die das Internet pausenlos mit KI-generierten Nonsense-Inhalten vollmüllen, schießen wie Pilze aus dem Boden. Gewiss, Spam war schon immer ein Problem des Internets, doch der synthetische Schrott, der in den digitalen Ozeanen herumtreibt, hat in seiner Masse eine ganz andere Qualität, weil er das digitale Ökosystem verschmutzt. Die Tauchroboter, die sogenannten Webcrawler, mit denen Suchmaschinen wie Google Webseiten nach Relevanz gewichten und indexieren, fischen in diesem Müllstrudel im Trüben – und verlieren ihre Orientierung.

So spuckte Google bei der Bildersuche nach „Tank Man“ – jenem mutigen Mann, der sich im Juni 1989 am Tiananmen-Platz in Peking einer Panzerkolonne entgegenstellte – im vergangenen Jahr ein KI-generiertes Fake-Selfie als Top-Ergebnis aus. Schon seit einiger Zeit beklagen Nutzer die nachlassende Qualität der Suchmaschine. Die Ergebnisliste sei mit Anzeigen und suchmaschinenoptimiertem Müll gepflastert, heißt es. Jahrelang konnten sich die Tech-Konzerne das Müllproblem vom Leib halten, indem sie einen digitalen Putztrupp auf den Philippinen beschäftigten, der für ein paar Dollar am Tag den Unrat aussortierte. Doch jetzt dringt dieser Müll an die klinisch reinen Benutzeroberflächen – und gefährdet die Attraktivität des Werbeumfelds. Die digitalen Klärwerke sind überfordert.

Auf Youtube gibt es mittlerweile eine ganze Reihe von Kinderkanälen wie „Super Crazy Kids“, die mithilfe von synthetisierten Audioschnipseln KI-generierte Animationsfilme produzieren (teils in fehlerhaftem Englisch). Es sind dümmliche, lieblos zusammengeschusterte Fetzen, die mit ihrem nervtötenden Gedudel („Teddy Bear, Teddy Bear“) einzig dazu gemacht sind, Kinder abzulenken. Der Autor Erik Hoel warnte in einem Blog vor einer „semantischen Apokalypse“: „Jetzt, wo Generative künstliche Intelligenz die Kosten der Bullshit-Produktion auf nahe null gesenkt hat, sehen wir klar die Zukunft des Internets: eine Müllhalde.“

Die Gegenwart des Internets ist aber erst mal Bergbau: Die Datenmineure bedienen sich an frei zugänglichen Text- und Bilddatenbanken wie an einem Steinbruch und trainieren mit dem Rohstoff ihre KI-Systeme. Während zahlreiche Nachrichtenseiten wie etwa die New York Times, CNN sowie der Guardian ihre Archive für die Webcrawler von OpenAI gesperrt haben, lizenziert das Onlineforum Reddit die Forenbeiträge an Google – für 60 Millionen Dollar im Jahr. Der Mikrobloggingdienst Tumblr und die Plattform WordPress.com verkaufen ihre Daten derweil an Midjourney und ­OpenAI. Mauern hier, Moneten da.

KI befeuert die soziale Schließung, die Tendenz zur Finanzialisierung und Fortifizierung des Webs, das in immer mehr hermetisch abgeriegelte Datensilos fragmentiert wird. Die Idee der KI-Vordenker besteht darin, das Internet in eine separate Box zu packen und in einen neuen Hypertext zu weben. Wenn ChatGPT den Dreißigjährigen Krieg erklärt, braucht man das World Wide Web im Grunde nicht mehr – zumindest nicht als Forum, Debattenraum oder Bibliothek, sondern nur noch als digitales Umspannwerk, um eine Verbindung zu den Servern herzustellen. Das Internet wird auf eine rein technische Funktion reduziert.

Das Problem: Es gibt aufgrund der Aushöhlung des Urheberrechts kaum noch finanzielle Anreize, Texte im Netz zu schreiben, welche hochleistungsfähige Sprachmodelle wie ChatGPT aber dringend brauchen, um sich weiterzuentwickeln. Die Gefahr eines KI- Kannibalismus ist daher real: Die datenhungrigen KI-Systeme könnten mangels Alternativen KI-generierte Inhalte fressen und in automatisierten Weiterverwertungsschleifen das ­vorgekaute Denken so lange wiederkäuen, bis sie am Ende einen substanzlosen Brei ausspucken.

Dass das Internet kaputt ist, ist ja keine neue Diagnose. Die Tech-Konzerne haben die Hyperlinkstruktur und damit die Vielfalt des World Wide Web zerschlagen und mit ihren affektökonomisch hochgetunten Algorithmen den Hass bis in die feinsten Kapillare der Gesellschaft injiziert. Doch je mehr die KI-Roboter die digitale Allmende abweiden und ihren Müll verbreiten, desto mehr kulturelle Brachen und Ödland entstehen im virtuellen Raum. Der Journalist James Vincent hat in einem klugen Essay für das Onlinemagazin The Verge geschrieben, dass wir gerade die Geburtswehen eines neuen Informationskosmos erleben: „Die KI killt das alte Web, und das neue Web kämpft, geboren zu werden.“

Nur: Wie und von wem wird dieses Internet gestaltet? Mit welcher Legitimation? Wem gehört es? Welche Such- beziehungsweise Kulturtechniken braucht es, um Informationen zu finden und zu verifizieren? Wie stellt man Öffentlichkeit her?

Die von der libertären Krypto-Community verfochtene Idee des Web3, die das Internet auf eine dezentrale Blockchain setzen will, denkt das Netz mehr als Vermarktungsmöglichkeit für die Creator-Industrie denn als digitale Gegenöffentlichkeit.

Und auch die Vision eines Metaverse, das Facebook-Gründer Mark Zuckerberg zum 3D-Internetnachfolger aufbauen will, wirkt noch papieren – Meta hat mit dem Prestigeprojekt einen zweistelligen Milliardenbetrag verbrannt. Vielleicht bleibt am Ende die leise Hoffnung, dass sich das alte Web reparieren lässt und in der Gated Community doch noch das eine oder andere Café eröffnet, wo man kein informationelles Fast Food aufge­tischt bekommt.

Der Journalist James Vincent hat in einem klugen Essay für das Onlinemagazin The Verge geschrieben, dass wir gerade die Geburtswehen eines neuen Informationskosmos erleben: „Die KI killt das alte Web, und das neue Web kämpft, geboren zu werden.“

It also requires a vast amount of computing resources, therefore it uses wastes tons of energy again, like large scale proof-of-work operations already started doing it before, and still do.

What Nvidia's Blackwell efficiency gains mean for DC owners • The Register
– via: https://news.ycombinator.com/item?id=39840593

https://www.heise.de/news/Stargate-Microsoft-soll-KI-Rechenzentrum-fuer-100-Milliarden-Dollar-planen-9671372.html

Problematisch für die Zukunft könnte auch werden, dass “Qualitätsmedien” aus finanziellen / Urheberrechtsgründen den Zugang für OpenAI & Co sperren, rechte Seiten das aber nicht tun, sondern ganz im Gegenteil der KI ihren Schrott anbieten und damit Trainingsdaten überproportional von rechts kommen könnten, siehe:

wir einfach kollektiv alles Denken und miteinander Sprechen abschaffen, und durch Prompt Engineering ersetzen, wie derzeit hinreichend und vielseitig apologetisiert. Keine Ahnung bei welchen Spätis diese Kollegen rumhängen, wo sie so etwas aufschnappen.

By carefully crafting prompts to be clear and concise, trainees can quickly understand the information being presented without the need for lengthy explanations. This reduces the time spent on reiterating or clarifying instructions during training sessions.

Clear and well-defined prompts leave little room for interpretation, reducing ambiguity and minimizing the likelihood of misunderstandings. This eliminates the need for additional clarification or correction, saving time that would otherwise be spent addressing confusion.

Heard on the Street – 3/28/2024 - insideBIGDATA

Der Optimismus der frühen 90er. Das Internet! :)

»With Bach, you get more tunes per square inch.«

Danke, Holger.

Ich meine, es war Küppersbusch, der neulich (auch in der taz?) beklagte, daß ihm nicht so sehr die Zunahme von künstlicher Intelligenz zu schaffen mache, sondern vielmehr die Abnahme von natürlicher Intelligenz…

1 Like

– via: Fefes Blog

1 Like

Killt nicht nur das Web. #Lavender

‘Lavender’: The AI machine directing Israel’s bombing spree in Gaza
‘The machine did it coldly’: Israel used AI to identify 37,000 Hamas targets | Israel-Gaza war | The Guardian
https://www.youtube.com/watch?v=4RmNJH4UN3s
Genocide in Gaza: Enabled by AI, powered by Big Tech | TV Shows | Al Jazeera

AI and chips are the new oil, what Blockchain hasn’t been able to.

Wait. AI and Blockchains are still running on oil?

Hatte ich gestern auch einen Beitrag zu gesehen. Hätte denen aber auch auffallen müssen, dass die Anzahl der “Verdächtigen” auf einmal sprunghaft angestiegen ist, hatten das die Amis nicht auch schon im Irak gemacht? Krieg ist immer scheisse, superscheiße x 3! :-( Mit oder ohne KI!

Es geht nicht unbedingt darum, ob irgendjemand etwas ausprobiert hat, es geht mir eher darum, dass mit dem aktuellen Trend und Hype der CONFIDENCY Regler VOLL aufgedreht wird, sowohl technisch als auch soziologisch. In bestimmten Kreisen, je nachdem wie man es braucht, natürlich mit VOLLER AKZEPTANZ, statt eher angemessener Zurückhaltung oder Reflektion. Endlich mal kurzfristig keinerlei versicherungstechnische Gründe mehr!

https://www.sciencedirect.com/science/article/pii/S0747563221003411
[2312.03733] Methods to Estimate Large Language Model Confidence
AI Outside In: Confidence Everywhere!

Die Frage ist ja warum der Mensch der KI so vertraut. Ist es wie früher bei Google: Der zweite Treffer ist schon ok, ich suche also nicht nach einem Optimum, sondern gebe mich mit einem lokalen Maximum zufrieden (“Faulheit”). Oder hat der Mensch mit KI-Systemen schon so gute Erfahrungen gemacht, dass man übergeneralisiert und der KI Domänen anvertraut, die man ihr besser nicht überlassen sollte?

Noch etwas zu dieser Untersuchung:

Als Psychologe sage ich mal, das ist zwar ein schönes Design und auch interessante Ergebnisse, ich bezweifle aber die externe Validität, sprich die Übertragbarkeit auf andere Bereiche. Dort wurde mit Schach-Stellungen gearbeitet, einer Expertise von der wir wissen, dass der Computer schon lange uns überholt hat. Wenn man weiß, dass ein normaler Spieler ein paar Züge weiterdenkt, eine Großmeister:in noch mal drei mehr und ein Rechner diese sehr begrenzte Domäne fast vollständig berechnen kann, würde auch ich eher dem Rechner vertrauen als mir. Wie gesagt das ist sehr Domänen-abhängig!

Aktuell finde ich es eigentlich erstaunlich, dass KI in Deutschland nicht – wie sonst häufig neue Technologien – verteufelt wird, sondern eher das Potential gesehen wird.

Am Ende ist es aber Medienkompetenzen, die wir als Individuum und Gesellschaft auch hier lernen müssen, und ob es die Influencer bei TikTok sind, Verschwörungstheoretiker in irgendwelchen Telegram-Gruppen oder eine halluzinierende oder mit schlechtem Modell ausgestattete KI ist, wir müssen versuchen die Geister zu unterscheiden,

Auch Deutschland versucht doch seit Jahren, aufzuholen, und auf irgendwelche Trends aufzuspringen, wobei es immer wieder auf solche hereinfällt, und Milliarden verbrennt, ohne sie besser in zukunftsweisende Basistechnologien und überhaupt Menschen statt Projekte zu investieren?

Ich sehe da überhaupt keine “Verteufelung sonst”, sondern durchgehend jahrelange Naivität und Hilfslosigkeit, zugunsten von Scharlatanen und Heilsversprechern die sich die Taschen vollmachen, und teilweise natürlich selbst daran glauben. Siehe auch die “Verstrickungen” von Fraunhofer und anderen in die diversen Blockchain Affären.

Fraunhofer Blockchain-Labor - Fraunhofer FIT

Wir schauen auf das Thema scheinbar aus völlig verschiedenen Perspektiven, auch bzgl. der “in Deutschland” Aspekte?

Ich finde schon, dass diejenigen Verantwortung tragen, die die Geister trainieren. Alles relevante ist straff durchorganisiert und -genormt, so dass das spezifizierte auch drin ist, und beispielweise nicht täglich Flugzeuge vom Himmel fallen.

Aber bei LLM Trainings sind Ausnahmen okay, und wir legitimieren im Machbarkeitswahn, dass auf CommonCrawl/Reddit-trainierte Dinge dazu beitragen, Demokratien zu zerstören und Leute zu verdummen?

Ganz schön viel auf einmal, vor allem wenn sich die einen an den anderen bedienen. Schließlich hat sich bisher niemand noch nichtmal die Bedienungsanleitung von Internet 1.0 bis zum Ende durchgelesen, und jetzt kommt schon Version 48.8?

Auch wenn vorher schon mit ähnlichen Systemen “getargeted” wurde, ist die absolut massenhafte Dimension im militärischen Fake SIGINT Komplex nun ein Stück weit jenseits der aufgezählten Probleme im Bereich von Fake News vs. Medienkompetenz angelangt?

Ich gehe schwer davon aus, dass es Palantir ist, die das Backend von Lavender liefern.

Well, indeed. – https://www.thenation.com/article/world/nsa-palantir-israel-gaza-ai/

https://www.timesofisrael.com/us-palantir-ceo-flies-company-board-to-israel-in-show-of-solidarity/
https://www.bnnbloomberg.ca/thiel-s-palantir-israel-agree-strategic-partnership-for-battle-tech-1.2021218

Die NSA scheint auch involviert, beim Zuliefern der Rohdaten. Netzpolitik berichtete ebenfalls schon früher.

Im Frontend dann Insta mit netten Fähnchen. Well done.

ErzUntGlas

Die Euphemismus Phrasendrescher laufen zur Hochform auf: Erzeugung eines gläsernen Gefechtsfeldes zur Unterstützung dynamischer Operationen.

Wer sich dafür interessiert, wie die so sozial und technisch ticken, jenseits davon dass man weiß, wer Peter Thiel ist, aber man vielleicht Alex Karp noch nicht so gut kennt.

20 Jahre am Markt, aber die riesengroße Bugwelle scheint jetzt erst richtig anzukommen?

Netto läuft es dann auf das folgende hinaus, ein BlutApprovalrausch mit AI Unterstützung.

“Genehmigen” oder “Abbrechen”?