Research

Das Qualitätsparadox: Warum sich Search für Google verbesserte, während es für Verlage verfiel

Drei Beweisschichten (zerfallender Verlags-Traffic, Alphabets Umsatzmix, das geleakte Google-Ranking-Schema) zeigen, warum keine algorithmische Erholung kommt.

Aus dem Inneren einer Digitalagentur sehe ich Dutzende Google-Analytics-Dashboards. Kunden quer durch die Nischen, Partner, mit denen ich seit Jahren arbeite, Freunde im Publishing, die mich in ihre Zahlen schauen lassen. Das Rückgangsmuster von 2024 bis 2026 ist auf eine Weise spezifisch, die nicht zu Googles erklärter Leitlinie passt, welche hilfreichen Inhalte belohnt werden. Manche Sites verloren neunzig Prozent ihres organischen Traffics. Andere blieben flach oder wuchsen. Die Trennlinie folgt einem strukturellen Merkmal des Inhalts, nicht der Qualität des Schreibens, und einem strukturellen Merkmal von Googles Umsatzmodell, das niemand laut benennen will.

Das Ziel hier ist also nicht, zu behaupten, SEO sei tot. Dieser Satz überlebt den Kontakt mit den Daten nicht, und er langweilt mich ohnehin. Ich will etwas Konkreteres zeigen: Zwischen 2023 und 2026 hat sich Googles Search-Geschäft verbessert (Umsatz hoch, AI-Features vom Management ausdrücklich als Treiber des Nutzungswachstums benannt, Anteil an Alphabet nur marginal geschrumpft), während die Verlagsebene, die historisch von Search abhing, entlang messbarer Achsen verfiel. Die beiden Trends sind eng korreliert. Das Produkt, dem Google die Beschleunigung von Search zuschreibt, ist dasselbe Produkt, dessen CTR-Daten zeigen, wie Verlage ihre Klicks verlieren. Das ist der seltsame Teil. Google hat es im Earnings Call selbst gesagt.

Drei Schichten, der Reihe nach. Zuerst das empirische Muster: eine Zerfallsmessung über 27 mittelgroße Verlags-Properties in sechs Nischen, 2022 bis 2026, anhand von Ahrefs-Schätzungen zum organischen Traffic. Dann die finanzielle Struktur: eine Zerlegung des von Alphabet berichteten Umsatzmix über 12 Quartale aus den Primärquellen der Earnings Releases, mit dem Blick darauf, was sich für Google änderte, während die Verlagsebene schrumpfte. Schließlich der algorithmische Mechanismus: der Google-Content-Warehouse-Leak vom März 2024, analysiert von Mike King bei iPullRank und Rand Fishkin bei SparkToro, der die Proxy-Signale auf Site-Ebene zutage fördert, die das Ranking konstruktionsbedingt gegen Verlage mit einzelnen Autoren und kleinen Betrieben verzerren.

Der Grund, warum niemand in der Branche diese drei Behauptungen an einem Ort zusammen aufstellen will, ist, dass sie gemeinsam einen Schluss nahelegen, der für beide Hälften des SEO-Diskurses unbequem ist. Die Hälfte „Google ist feindselig gegenüber Creators" liegt falsch: Google hat Verlage in keinem aktiven Sinn getötet. Die Hälfte „Google belohnt Qualität" liegt ebenfalls falsch: Die Proxys, die das Ranking steuern, messen keine Qualität. Beide Hälften kreisen um eine Tatsache, die keine von ihnen ausspricht. Google braucht das offene Web weiterhin als Rohstoff, aber es muss nicht mehr genug Wert über Klicks zurückleiten, um die Ökonomie der mittelgroßen Verlage zu tragen. Die Inhaltsebene wurde nicht nutzlos. Die über Klicks geleitete Subvention, die sie finanzierte, schon.

Eine Einordnung vorab, bevor die Belege kommen. Das hier ist keine Arbeit zur kausalen Identifikation, und ich werde nicht so tun, als ergäben drei Datensätze ein kontrolliertes Experiment. Es ist ein Triangulationsargument: Drei unabhängige Flächen (Traffic-Daten, Finanzberichte, ein geleaktes Ranking-Schema) zeigen auf dieselbe strukturelle Verschiebung, und die Version der Ereignisse, die zu allen dreien zugleich passt, ist die, die ich verteidige. Wo der Beleg Schlussfolgerung statt Beweis ist, sage ich es.

Was 27 Verlags-Sites verraten

Ich begann mit einer Frage und einer Liste. Die Frage: Verlief der Verlagskollaps seit 2022 gleichmäßig über die Inhaltstypen hinweg, oder steckt Struktur darin? Die Liste: 27 mittelgroße Verlags-Properties in sechs Nischen, von der Sorte, die im Fenster 2013–2018 heranwuchs, als die Formel aus SEO, AdSense und Evergreen-Content noch funktionierte. Reise: Nomadic Matt, The Blonde Abroad, Expert Vagabond, Never Ending Footsteps, Adventurous Kate, The World Pursuit. Rezepte: Smitten Kitchen, Pinch of Yum, Minimalist Baker, Half-Baked Harvest, Sally's Baking Addiction. Tech-How-to: How-To Geek, MakeUseOf, Instructables, Beebom, AddictiveTips. Hobby und Handwerk: Allfreesewing, Crochetkim. Privatfinanzen: Mr. Money Mustache, Wise Bread, Get Rich Slowly, Frugalwoods, Budgets Are Sexy. Lifestyle: Apartment Therapy, Cup of Jo, Design Mom, Alpha Mom.

Manche davon sind Ein-Autor-Betriebe, andere gehören zu Digital-Media-Portfolios. How-To Geek und MakeUseOf gehören Valnet (übernommen 2023 bzw. 2020), Instructables gehört Autodesk (seit 2011), Allfreesewing ist Teil von Prime Publishing. Große Medienkonzerne (Condé Nast, Hearst, Recurrent Ventures) habe ich bewusst ausgeschlossen. Die Stichprobe besteht aus mittelgroßen Verlags-Properties: größer als persönliche Blogs, kleiner als Enterprise-Medien. Genau auf dieser Ebene sollten Googles erklärte Helpful-Content-Kriterien am direktesten greifen.

Für jede Site habe ich monatliche Schätzungen zum organischen Traffic aus Ahrefs gezogen, Januar 2022 bis April 2026. 1.404 monatliche Beobachtungen über 27 Domains. Der Peak-Monat ist definiert als der Monat mit dem höchsten zwölfmonatigen gleitenden Traffic-Durchschnitt, beschränkt auf die Zeit vor August 2024, damit eine Erholung nach AI Overviews nicht mit dem tatsächlichen Peak verwechselt werden kann. „Current" sind die letzten drei Monate (Februar bis April 2026), um Index-Artefakte einzelner Monate zu glätten. Der Inflection-Monat ist das erste Mal nach dem Peak, in dem der gleitende Dreimonatsdurchschnitt um fünfzehn Prozent oder mehr fällt und der Rückgang über die folgenden drei Monate Bestand hat. Das fängt den Auslöser der Klippe ein, nicht den Boden des Abrutschens.

Ahrefs liefert eine Schätzung. Es ist nicht die Grundwahrheit. Die Schätzungen leiten sich aus einem Keyword-Korpus und einem Klickmodell ab, und wenn Ahrefs neue Keywords aufnimmt oder das Modell neu kalibriert, können sich sämtliche historischen Schätzungen verschieben. Konkrete Datenqualitätsbedenken markiere ich dort, wo sie zählen. Der relative Vergleich zwischen Sites und die relative Lage der Inflection-Monate sind verlässlicher als jede einzelne absolute Zahl.

Zerfall des organischen Verlags-Traffics 2022–2026, 27 Sites auf den Peak normiert

Der Kernbefund ist, dass der Kollaps zweigeteilt ist, nicht gleichmäßig. (Ich sage zweigeteilt, nicht bimodal: n=27 zeigt eine klare Trennung in Gewinner und Verlierer, ist aber zu klein, um zwei formale statistische Modi zu behaupten.) Von den 27 Sites:

  • 5 sind katastrophal: 90 Prozent oder mehr ihres Peak-Traffics verloren (How-To Geek, AddictiveTips, MakeUseOf, Expert Vagabond, The World Pursuit)
  • 7 verloren 50 bis 89 Prozent (Mr. Money Mustache, Frugalwoods, Wise Bread, Nomadic Matt, Minimalist Baker, Crochetkim, Allfreesewing)
  • 8 verloren 1 bis 49 Prozent (die moderate Mitte)
  • 7 wuchsen oder blieben flach (Never Ending Footsteps +188%, Beebom +168%, Adventurous Kate +72%, Budgets Are Sexy +45%, Instructables +23%, Half-Baked Harvest +19%, The Blonde Abroad +7%)

Der mediane Rückgang über die gesamte Stichprobe liegt bei −31 Prozent. Der Mittelwert bei −20 Prozent. Das sind keine „Verlags-Apokalypse"-Zahlen, es sind Zweiteilungs-Zahlen. Einige Sites starben vollständig. Viele Sites gingen moderat zurück. Eine nennenswerte Minderheit wuchs durch dasselbe Fenster hindurch.

Die Aufschlüsselung nach Nische schärft die Zweiteilung:

NischeSitesMedianer Rückgang
Rezepte5−10%
Reise6−27% (große Spanne)
Lifestyle4−30%
Privatfinanzen5−53%
Hobby und Handwerk2−79%
Tech-How-to5−93%

Medianer Traffic-Rückgang nach Nische, Peak 2022 gegen Februar–April 2026

Rezept-Sites überlebten weitgehend. Tech-How-to-Sites wurden ausgeweidet. Das ist eine Spanne von 83 Punkten zwischen der Nische, die am besten abschnitt, und der, die am schlechtesten abschnitt, auf demselben Algorithmus, im selben Fenster. Lifestyle hielt sich; How-to und Handwerk kollabierten; Reise und Privatfinanzen spalteten sich.

Schau dir jetzt an, wann die Klippen kamen. Über die 23 erkannten Inflection-Monate hinweg (vier Sites gingen allmählich zurück, ohne sauberen Inflection-Auslöser) sieht die Verteilung so aus:

  • August bis Dezember 2022 (erste HCU-Einführungsphase): 2 Inflections
  • September bis Dezember 2023 (HCU September 2023 plus Oktober- und November-Core-Updates): 6 Inflections
  • Januar bis April 2024 (März-2024-Core-Update): 1 Inflection
  • Mai bis August 2024 (AI-Overviews-US-Launch am 14. Mai): 1 Inflection
  • Ab Q4 2024 (Post-AIO-Drift): 11 Inflections

In diesem Datensatz häuft sich die größte synchronisierte Klippe rund um die HCU vom September 2023 und die unmittelbar aufeinanderfolgenden Oktober- und November-Core-Updates. Sechs von dreiundzwanzig erkannten Inflections fallen in dieses zwölfwöchige Fenster. The World Pursuit (Oktober 2023), MakeUseOf (Oktober 2023), AddictiveTips (November 2023), Crochetkim (November 2023), Allfreesewing (Dezember 2023) und The Blonde Abroad (Dezember 2023) begannen alle in dieser Zeit ihren Rückgang.

Die HCU vom August 2022, die mit dem Marken-Ruf, zählt weniger, als ihr Ruf vermuten lässt. Nur zwei Inflections fallen ins Fenster August–Dezember 2022. Die ursprüngliche HCU war real, aber mild im Vergleich zu dem, was dreizehn Monate später kam.

Der AI-Overviews-US-Launch (14. Mai 2024) ist als diskreter Auslöser kaum sichtbar. Eine Inflection im unmittelbaren Fenster nach dem Launch. AIO zählt intensiv für die Click-through-Rates auf den Queries, die es abdeckt: Ahrefs maß einen Rückgang von 34,5 Prozent bei der CTR der bestplatzierten Seite, wenn ein AIO präsent ist (Ahrefs, April 2025; eine aktualisierte Ahrefs-Analyse vom Februar 2026 mit neueren GSC-Daten bezifferte den Wert auf 58 Prozent an Position 1). Aber es taucht in den Traffic-Schätzungen nicht als scharfe Inflection auf, so wie es die HCU tut. Die 11 Post-AIO-Inflections über Q4 2024 und 2025 sind langsame Drift, keine Klippen.

Die Daten sagen also: Die HCU 2023 war die Klippe. AIO ist die Drift. Eine Nuance zu AIO allerdings: Es verhält sich in diesen Daten nicht wie ein Schock am Launch-Datum, und so sollte man es auch nicht lesen. Es verhält sich wie ein Bremszug durch Flächen-Adoption. Query-Abdeckung, Nutzerverhalten und SERP-Antwortqualität dehnen sich mit der Zeit aus, also addiert sich die Klick-Unterdrückung allmählich, statt am 14. Mai 2024 niederzugehen. Die benannte HCU 2022 und das benannte AIO vom Mai 2024 sind beide real, aber keines von beiden ist hier der größte einzelne diskrete Auslöser.

Zwei Vorbehalte sind eine ehrliche Offenlegung wert. The World Pursuit verlor 99,8 Prozent seines Traffics, aber eine Live-Prüfung der Site zeigt, dass die Betreiber im Februar 2024 aufhörten zu publizieren. Die Klippe im Oktober 2023 war ein realer Algorithmus-Einschlag, aber das anschließende Abrutschen in den einstelligen Visit-Bereich war Aufgabe, nicht bloß Strafe. Mr. Money Mustache zeigt das sauberste Beispiel für „Post-AIO-Drift wird zu einer diskreten Klippe": ein allmählicher Anstieg bis Anfang 2025, gefolgt von einem scharfen Einbruch ab August 2025. Das Timing ist verdächtig genug, um eine Prüfung über eine zweite Quelle zu rechtfertigen, bevor man es als reinen Algorithmus-Einschlag behandelt. Das Wachstum von Beebom (+168 Prozent) ist der einzige Ausreißer in der Katastrophen-Nische. Der Sprung von rund 3 Mio. auf 10 Mio. Visits in drei Monaten liest sich eher wie eine Modell-Neukalibrierung bei Ahrefs als wie eine echte Traffic-Verdopplung über Nacht.

Wenn man alle drei verdächtigen Datenpunkte entfernt, ändert das am zweigeteilten Muster nichts. Die Reihenfolge der relativen Rückgänge über die Nischen bleibt bestehen, und das Klippen-Timing Ende 2023 auch.

Hier wird das Datenbild mechanismus-verräterisch. Zerstört wurde Inhalt, bei dem die Query eine zusammenfassbare Antwort hat. How-to-Artikel („wie konvertiere ich eine Videodatei", „wie aktiviere ich den Dark Mode"), Tech-Tipps, Definitionen, faktische Nachschläge. Die Antwort passt in drei Sätze. AI Overviews kann sie direkt in der SERP liefern, und der Nutzer muss nicht durchklicken.

Überlebt hat Inhalt, bei dem die Seite selbst das Ziel ist. Ein Rezept ist die Seite. Du gehst zu Smitten Kitchen, weil du die Kekse backen wirst. AI Overviews kann das Rezept in der SERP zusammenfassen, aber der Nutzer braucht trotzdem die vollständige Zutatenliste, die Zeiten, das Bild vom Teig und die Kommentare darunter von Leuten, die braune Butter substituiert haben. Lifestyle-Artikel werden für die Stimme und die Details der Autorin gelesen; sie lassen sich nicht komprimieren, ohne genau das zu verlieren, was konsumiert wird. Persönliche Essays. Langform-Analyse. Fotografische Inhalte. Die Seite ist das, weswegen du gekommen bist.

Es lohnt sich, daraus eine echte Variable zu machen statt eines Bauchgefühls. Nenn es Antwort-Komprimierbarkeit: Eine Inhaltskategorie ist hoch komprimierbar, wenn sich die Suchintention des Nutzers durch eine kurze prozedurale, definitorische oder faktische Antwort befriedigen lässt, ohne dass die Seite als Artefakt konsumiert werden muss. How-to-, Definitions- und Rechner-Queries sind hoch komprimierbar. Rezept-, Lifestyle-, Langform-Essay- und fotografische Inhalte sind niedrig komprimierbar, weil die Seite selbst das ist, weswegen du gekommen bist, und nicht eine Hülle um eine Drei-Sätze-Antwort.

Das macht aus Mechanismus A eine falsifizierbare Vorhersage: Hoch komprimierbare Inhalte sollten über das HCU-und-AIO-Fenster überproportional mehr organischen Traffic verlieren als niedrig komprimierbare Inhalte. Die Daten, Nische für Nische, passen dazu. Rezepte (−10%): niedrig komprimierbar, überlebten. Lifestyle (−30%): niedrig komprimierbar, überlebten. Tech-How-to (−93%): hoch komprimierbar, zerstört. Hobby und Handwerk (−79%): hoch komprimierbar, zerstört. Reise (gemischt, −27%): gespalten, weil informationsorientierte Reise-Queries hoch komprimierbar sind und erlebnisorientierte Reiseinhalte nicht, und die Nische zeigt beide Extreme. Privatfinanzen (gemischt, −53%): aus demselben Grund gespalten. Rechner-artige Queries sind hoch komprimierbar; Essays zur persönlichen Philosophie nicht.

Der Mechanismus, der diese Vorhersage trägt, taucht an zwei Stellen auf. Im Algorithmus selbst, zu dem wir in Abschnitt vier kommen. Und in Googles eigenem Umsatzmodell, das als Nächstes dran ist.

Warum Googles Anreiz, das zu beheben, weg ist

Das Standardnarrativ rund um den Verlagsrückgang enthält eine stille Hoffnung: Irgendwann häufen sich die Beschwerden, der Algorithmus wird korrigiert, der Traffic fließt zurück zu guten Sites. Google hat benannte Systeme schon revidiert. Die HCU vom August 2022 wurde im März 2024 als eigenständiges benanntes System eingestellt und ins Core-Ranking-System aufgenommen. Das mentale Modell unterstellt, Google habe einen Anreiz, das Verlags-Ökosystem am Leben zu halten, weil Search Verlagsseiten als Ziel braucht, auf das die Nutzer klicken.

Dieses mentale Modell funktionierte, als Search der dominante Anteil an Alphabets Umsatz und Wachstum war. Es funktioniert nicht mehr. Um zu sehen, warum, schaut man am saubersten auf Alphabets vierteljährlich berichteten Umsatzmix aus Primärquellen, den Earnings Releases, auf denen die 10-Q-Berichte aufsitzen.

Ich habe die letzten 12 berichteten Quartale gezogen, Q2 2023 bis Q1 2026 (das jüngste Quartal zum Zeitpunkt dieses Textes, veröffentlicht am 29. April 2026). Jede Zahl unten stammt vom Investor-Relations-CDN von Alphabet, wo sie jede Quartalsmeldung als PDF veröffentlichen, gegengeprüft mit der Vergleichsspalte der jeweils folgenden Quartalsmeldung. Keine Analystenschätzungen, keine Drittanbieter-Aggregate.

Entwicklung des Alphabet-Umsatzmix, Q2 2023 bis Q1 2026

Drei Dinge stechen heraus.

Erstens hat sich der Anteil von Cloud an Alphabet ungefähr verdoppelt. Google Cloud stieg von 10,8 Prozent des konsolidierten Umsatzes in Q2 2023 auf 18,2 Prozent in Q1 2026. Google Search & other rutschte im selben Fenster von 57,1 Prozent auf 55,0 Prozent. Cloud nahm in drei Jahren rund siebeneinhalb Prozentpunkte des Umsatzmix auf. Die anderen Segmente hielten ihre relativen Anteile bis auf ein paar Punkte: Cloud ist das Segment, das sein Stück vom Kuchen vergrößerte.

Zweitens ist Cloud in absoluten Dollar der Motor des marginalen Wachstums, auch wenn Search absolut weiterhin der größere Beitrag ist. Über das Fenster legte Cloud 12,0 Milliarden Dollar Quartalsumsatz zu (von 8,03 Mrd. auf 20,03 Mrd. $, +149 Prozent). Search legte 17,8 Milliarden Dollar Quartalsumsatz zu (von 42,63 Mrd. auf 60,40 Mrd. $, +42 Prozent). Search fügte von einer viel größeren Basis aus mehr absolute Dollar hinzu, was die Nuance ist, die der Artikel nicht verschütten sollte. Aber Cloud beschleunigte seine Jahreswachstumsrate über das Fenster (+28,9% YoY in Q2 2024, ansteigend auf +63,4% YoY in Q1 2026), während die Wachstumsrate von Search zwischen +9,8% (Tiefpunkt) und +19,1% (jüngstes Quartal) pendelte. Cloud wächst mehr als dreimal schneller als Search.

Drittens, und das ist der Teil, der für Verlage zählt: Der Umsatz auf der Search-Linie wächst weiter, während die organischen Verlags-Klicks zurückgehen. Die CTR-Studien sagen, dass für Queries mit einem AI Overview die bestplatzierte Seite 34,5 Prozent weniger Klicks bekommt als vergleichbare Queries ohne eines (wieder Ahrefs; das Update vom Februar 2026 setzt den Wert höher bei 58 Prozent an). Die Authoritas-Studie zu britischen News-Verlagen fand einen CTR-Verlust pro Query von fast 50 Prozent (Press Gazette, 2025). Der tägliche Traffic von Stack Overflow fiel nach ChatGPT um rund 12 Prozent (Burtch, Lee & Chen, 2024, Scientific Reports), und das Volumen neuer Fragen fiel laut dem öffentlichen Stack-Exchange-Datendump um rund 75 Prozent gegenüber dem Peak von 2017 (Holscher, 2025). Die Trendlinien zeigen in dieselbe Richtung: Klicks verlassen die Verlagsebene.

Doch Googles Umsatz auf der Search-Linie wuchs durch denselben Zeitraum. Q1 2026: +19,1 Prozent im Jahresvergleich. Die Zusammensetzung dieses Wachstums, was es antreibt, steht nicht vollständig in der Segmenttabelle der Pressemitteilung. Pichais genaue Zeile aus der Pressemitteilung lautet, „Search had a strong quarter with AI experiences driving usage, queries at an all-time high, and 19% revenue growth." Im begleitenden Earnings Call dehnte die Führung das aus und benannte AI Overviews und AI Mode ausdrücklich als Nutzungstreiber, neben vertikaler Stärke in Retail und Finanzen als separaten Umsatzbeiträgen. Niemand bei Alphabet hat quantifiziert, wie viel der Beschleunigung auf AI-Features entfällt im Vergleich zu den anderen Treibern. Aber sie haben diese Features als materiell benannt, und das genügt für das Argument: Das Produkt, das der Verlagsebene die Click-through-Rate nimmt, ist dasselbe Produkt, dem Google das Wachstum von Search zuschreibt.

Aus Verlagssicht gelesen ist das ein sauberer Kausalpfeil. AI Overviews extrahiert Wert aus Verlagsinhalten (es ruft ab, fasst zusammen und zeigt zur Servierzeit, was Verlage geschrieben haben, während Gemini-Klasse-Modelle auch breiter auf menschlichem Text in Web-Größenordnung trainiert werden), ohne den Nutzer zum Verlag zu leiten. Der Nutzer bekommt die Antwort, bleibt auf Googles Fläche, sieht Googles Anzeigen und besucht nie die Site, von der die Information stammte. Alphabet berichtet in seiner Segmenttabelle keine Monetarisierung pro Query, also ist „die Monetarisierung pro Query stieg für Google" eine Schlussfolgerung aus der Kombination von wachsendem Search-Umsatz und den CTR-Studien oben. Die Schlussfolgerung ist geradlinig: derselbe Produktmechanismus, gegensätzliche Folgen für Verlag und Plattform.

Aus Googles Sicht gelesen ist das rationale Allokation. Als Search Verlagsseiten als Ziel brauchte, auf das die Nutzer klickten, war die Gesundheit der Verlage Googles Problem. Das Schwungrad drehte sich nur, wenn es guten Inhalt gab, auf den der Link zeigen konnte. Jetzt ist das Ziel die SERP selbst, bestückt mit AIO-Zusammenfassungen, der Discussions-Box, die aus Reddit zieht (der von Reuters im Februar 2024 berichtete Reddit-Google-Daten-Lizenzdeal über 60 Mio. $ pro Jahr war kein Zufall), dem Knowledge Panel, dem People Also Ask, den eingebetteten Video-Clips. Verlage wurden zu Inputs für ein Ziel, das Google jetzt besitzt, statt Ziele zu sein, auf die Google die Nutzer verwies. Search verfiel nicht für Google. Search wurde aufgewertet, um Wert auf der SERP-Ebene zu extrahieren, statt ihn durchzuleiten.

Das ist es, was sich geändert hat. Nicht „Google tötete Verlage", dieser Rahmen ist zu aktiv. Der Rahmen ist, dass Google das Suchprodukt so umbaute, dass die Verlagsebene zu einem vorgelagerten Inhalts-Lieferanten wurde statt zum nachgelagerten Ziel der Klicks. Lieferanten lassen sich ersetzen, neu kombinieren oder entfernen, sobald ihre Substitute gut genug sind. Ziele ließen sich das nicht. Die Verschiebung vom Ziel zum Lieferanten macht die Verlagsposition strukturell schwächer, und sie macht die Algorithmusänderungen selbstverstärkend statt selbstkorrigierend.

Die Standardantwort auf dieses Argument lautet „Search ist immer noch das größere absolute Geschäft, schau auf die Dollar". Stimmt. Die Daten sagen nicht, dass Search kollabiert oder stirbt. Die Daten sagen, Search ist gesund für Google. Sie sagen auch, dass Search langsamer wächst als Cloud, dass Cloud seine Wachstumsrate relativ zu Search etwa verdreifacht, und (wichtig für die Verlagsfrage) dass Search gesund ist, obwohl es weniger Klicks an seine zugrunde liegende Inhaltsebene sendet. Gesundheit für Google und Gesundheit für Verlage sind nicht mehr dasselbe. Sie waren deckungsgleich, als das Schwungrad Verlagsseiten zum Drehen brauchte. Sie sind entkoppelt, jetzt da sich das Schwungrad innerhalb der SERP dreht.

Eine nützliche Asymmetrie zum Festhalten. Das berichtete Backlog von Cloud „nearly doubled quarter on quarter to over $460 billion" laut Alphabets Q1-2026-Earnings-Release. Annualisiert man den Cloud-Umsatz aus Q1 2026 (20,03 Mrd. $ × 4 = ~80 Mrd. $), sind 460 Mrd. $ Backlog grob das 5,7-Fache dieser Zahl (wobei „Backlog" hier vertraglich gebundener künftiger Umsatz ist, RPO, nicht dasselbe wie eine Committed-Pipeline-Zahl, die du bei einem Startup sehen würdest). Der berichtete Mix kann interne Priorität nicht beweisen, aber er macht die Haltung lesbar: Search bleibt der Cash-Motor, Cloud ist das Narrativ des künftigen Wachstums. Die Berichte beweisen die Umsatz-Asymmetrie, nicht die Psychologie im Vorstand. Was die Asymmetrie nahelegt, ist bescheiden, aber real: Die strategische Aufmerksamkeit innerhalb von Alphabet (Capex-Allokation, Hiring-Priorität, Beförderungen im Management) folgt tendenziell Wachstumsrate und Backlog, und auf diesen Metriken ist Search nicht mehr der Ort, an dem die Geschichte spielt.

Das erklärt mechanisch, warum kein Algorithmus-Rollback kommt. Die Degradierung der Verlagsebene ist kein bedauerlicher Nebeneffekt eines aktualisierten Ranking-Systems, das Google lieber nicht ausgeliefert hätte. Sie ist das vorhersehbare Ergebnis davon, die Ziel-Ebene auf Googles Fläche zu verlegen, und genau das sind AIO und AI Mode. Den Algorithmus auf das vorherige Gleichgewicht zurückzudrehen würde verlangen, die Produktlinie zurückzunehmen, die die Umsatzbeschleunigung von Search erklärt. Das passiert nicht.

Warum der Algorithmus die Verzerrung hat, die er hat, konstruktionsbedingt

Abschnitt 3 zeigte, dass sich Googles Anreizstruktur verschoben hat: Search kann wachsen, während die Verlags-Verweise zurückgehen, weil die Monetarisierung pro Query auf die SERP gewandert ist. Dieser Abschnitt zeigt den algorithmischen Mechanismus, der die Verschiebung dauerhaft macht.

Es laufen zwei Mechanismen parallel, und die Daten aus Abschnitt 2 haben sie für uns getrennt, ohne dass wir es wussten.

Mechanismus A ist die Zusammenfassbarkeit des Inhalts. Die How-to-Queries sterben, weil die Antwort der gesamte Inhalt ist, drei Sätze und der Nutzer ist fertig. Die Rezept-Queries überleben, weil das Rezept das ist, was du mit der Antwort tust, nicht die Antwort selbst. Mechanismus A erklärt, welche Inhalts-TYPEN überhaupt überleben.

Mechanismus A wirkt über zwei Flächen mit unterschiedlichem Timing. Die Klippen von 2023 in den Daten oben liegen acht Monate vor AI Overviews. Die HCU vom September 2023 und die unmittelbar aufeinanderfolgenden Oktober-/November-Core-Updates degradierten direkt Inhalt, den der Algorithmus als nicht hilfreich klassifizierte. Empirisch war der Inhalt, den der Helpful-Content-Klassifizierer herabstufte, dieselbe Art Inhalt, die sich in drei Sätzen zusammenfassen lässt: schablonierte How-tos, dünne Referenz-Posts, immergrüne Ein-Absatz-Definitionen. Dann startete im Mai 2024 AI Overviews und begann, Klicks auf genau diese Query-Typen von einer anderen Fläche aus zu unterdrücken. Statt das Ergebnis herabzustufen, zeigt es die Antwort in der SERP, damit die Nutzer nicht durchklicken. Dieselbe Inhaltskategorie ins Visier genommen, zwei verschiedene Mechanismen, zwei verschiedene Timing-Fenster. Die Drift 2024–2025 in den Daten ist die AIO-Hälfte; die Klippen von 2023 sind die HCU-Hälfte.

Mechanismus B sind die Proxy-Signale auf Site-Ebene. Googles Ranking-System berechnet site-weite Trust-Scores aus beobachtbaren Korrelaten der operativen Infrastruktur: Backlinks, Chrome-Clickstream-Volumen, Geschwindigkeit der Markensuche, anhaltende Erwähnungsdichte in News-Korpora, Vollständigkeit des Schema-Markups. Diese Signale skalieren mit Enterprise-Content-Betrieben, nicht mit Erfahrung aus erster Hand. Mechanismus B erklärt, wer unter den überlebenden Inhaltstypen GEWINNT.

Zusammen beantworten sie das Rätsel, das Ein-Mechanismus-Erklärungen nicht können. Eine Erklärung allein aus dem Signal-Katalog kann nicht erklären, warum Smitten Kitchen (Rezept, unabhängig mit einer Stimme, −3,5%) neben How-To Geek (Tech-How-to, größerer operativer Fußabdruck, −93%) überlebt. Eine Erklärung allein aus der Zusammenfassbarkeit kann nicht erklären, warum Apartment Therapy (Lifestyle, größerer Markenbetrieb, −39%) Frugalwoods (Privatfinanzen, ein Autor, −60%) innerhalb der Nischen schlägt, die nicht kategorisch zerstört wurden. Mechanismus A bestimmt, welche Inhalts-TYPEN Algorithmus und AIO gemeinsam aus der Klick-Ökonomie entfernen; Mechanismus B bestimmt, welche Sites unter den Überlebenden gewinnen. Die zweigeteilten Daten sind genau das, was man erwarten würde, wenn beide Mechanismen wirken.

Mechanismus A ist von außerhalb Googles beobachtbar. AI Overviews sind öffentlich; die Queries, auf denen sie erscheinen, sind öffentlich; die Zitate, die sie enthalten, sind öffentlich; die Click-through-Rates wurden von Ahrefs, Authoritas und anderen gemessen. Keine Insider-Information nötig.

Mechanismus B ist genau dort, wo der Google-Leak zählt.

Die geleakten Signale

Von März bis Mai 2024 gab Erfan Azimi rund 14.014 Attribute aus Googles interner Content-Warehouse-API-Dokumentation frei. Rand Fishkin bei SparkToro und Mike King bei iPullRank veröffentlichten ihre Analysen am 27. Mai 2024, am selben Tag. Google bestätigte die Echtheit über ein Statement gegenüber The Verge (auch von Search Engine Land berichtet), das das Schema nicht abstritt, aber einschränkte, manche Attribute könnten „out-of-context, outdated, or incomplete" sein.

Die Teilmenge der Attribute, die für Qualität und Vertrauen auf Site-Ebene am relevantesten sind, die Schicht, die das Ranking offenbar prägt, bevor irgendeine seitenspezifische Relevanzarbeit greift, ist klein und konsistent. Der Leak zeigt Attributnamen und -typen in der API-Dokumentation, nicht aktive Gewichte oder den aktuellen Deployment-Status, also behandle den Katalog unten als das Gerüst, auf dem das System gebaut ist, nicht als Beweis irgendeiner spezifischen aktuellen Gewichtung. Mike Kings Analyse ist der rigoroseste Durchgang. Hier sind die tragenden Signale.

Abbildung 4·Mechanismus-Architektur·Signale auf Site-Ebene ins Ranking

Sechs Signale auf Site-Ebene liegen im geleakten Schema neben der Qstar-Schicht. Die Attribute für Erfahrung aus erster Hand nicht.

Jede Karte unten ist ein reales Protobuf-Feld aus dem Content-Warehouse-Leak. Die Geister-Reihe zeigt Attribute, deren Existenz die E-E-A-T-Botschaft impliziert und die in der geleakten Fläche schlicht nicht auftauchen.

Ranking-Einfluss auf Site-Ebene
Qstar-Schicht
Im geleakten Schema vorhanden · 6 Attribute
  • siteAuthoritySite-weiter Autoritäts-Scorescore
  • chromeInTotalChrome-Clickstream-Volumensignal
  • hostNsrNormalisierter Site-Rank auf Host-Ebenescore
  • siteFocusScoreThematischer Fokusscore
  • siteRadiusEmbedding-Distanzvector
  • smallPersonalSiteHobby-Site-Flagflagumstritten
Kein passendes Feld in der geleakten Fläche
Nicht im geleakten Schema · 2+ erwartete Attribute
  • firstHandExperiencenicht im Schema

    Würde eine Attribution „Ich war tatsächlich dort" markieren.

  • authorWasActuallyTherenicht im Schema

    Würde den „Experience"-Anspruch aus E-E-A-T modellieren.

Vorbehalt · der Leak ist nach Googles eigenem Eingeständnis unvollständig. Die Abwesenheit dieser wörtlichen Feldnamen aus der geleakten Fläche beweist nicht, dass Google ein Erfahrungs-Signal fehlt.

Qstar (Ranking-Schicht)Im SchemaErwartet · abwesend
Quellen: Content-Warehouse-API-Leak (März 2024) · iPullRank · SparkToro
Attributnamen aus GoogleApi.ContentWarehouse.V1.Model.* Protobuf-Definitionen, die im Leak vom März 2024 offengelegt wurden. Die sechs oben genannten sind im geleakten Schema als Attributdefinitionen vorhanden, nicht als bestätigte Live-Ranking-Gewichte. Die Namen der Geister-Reihe sind synthetisiert; sie beschreiben, was ein E-E-A-T-treues Schema bräuchte, und tauchen in der geleakten Fläche nicht auf.

Die Status-Spalte ist bewusst vorsichtig: Die Präsenz eines Feldes im geleakten Schema bestätigt, dass Google das Konzept intern repräsentiert, nicht, dass das Feld ein bekanntes Gewicht im Live-Ranking trägt. Mike King macht denselben Vorbehalt: Die Dokumentation zeigt Attribute, keine Scoring-Funktionen oder Pipeline-Verdrahtung.

SignalWas es zu messen scheintWarum es gegen Unabhängige verzerrtStatus
siteAuthoritySite-weiter Autoritäts-ScoreEin site-weiter Multiplikator, kein einzelner Post kann einen niedrigen Site-Score überholenIm Schema; öffentlich von Google bestritten. Bestätigt, dass eine Domain-Authority-Repräsentation existiert. Live-Gewicht unbekannt.
chromeInTotalChrome-Clickstream-Volumen auf Site-EbeneUnabhängige Sites ohne Distribution haben eine Baseline nahe null; das Signal verstärkt sich mit der Reichweite, nicht mit der InhaltsqualitätIm Schema; steht gegen John Muellers öffentliche Position, dass die einzigen fürs Ranking genutzten Chrome-Daten CrUX-Page-Experience-Aggregate sind. Live-Gewicht unbekannt.
hostNsrNormalisierter Site-Rank auf Host-EbeneEine Site, deren Chunks als eine einzige Hobbyisten-Stimme lesen, bekommt einen Score für den ganzen HostIm Schema; Nutzung/Gewicht unbekannt
siteFocusScoreWie thematisch fokussiert die Site istPersönliche Sites, die Reise + Code + Essays mischen, lesen sich konstruktionsbedingt als unfokussiertIm Schema; Nutzung/Gewicht unbekannt
siteRadiusWie weit die Seiten-Embeddings vom Site-Embedding abweichenEin Essay aus erster Hand außerhalb des thematischen Schwerpunkts der Site würde unabhängig von der Qualität strukturell bestraftIm Schema; Nutzung/Gewicht unbekannt
smallPersonalSiteFlag für kleine persönliche SitesMarkiert „dies ist eine Hobby-Site" als interne Kategorie, die der Ranking-Code lesen kannIm Schema; Richtung (Boost vs. Demote) umstritten

Zwei Auslassungen sind eine Markierung wert, mit dem stehenden Vorbehalt, dass der Leak nach Googles eigenem Eingeständnis unvollständig ist, ein fehlender wörtlicher Feldname also keine Abwesenheit eines entsprechenden Mechanismus beweist. Kein firstHandExperience-Attribut taucht in der geleakten Fläche auf. Auch kein authorWasActuallyThere-Attribut. Die Abwesenheit beweist nicht, dass Google ein Erfahrungs-Signal fehlt: Erfahrung könnte über Quality-Rater-Pipelines, Embeddings oder Entity-Systeme abgeleitet werden, die der Leak nicht offenlegt. Sie beweist etwas Engeres. Das öffentliche Konzept der „Erfahrung aus erster Hand" ist im geleakten Schema nicht mit annähernd der Explizitheit repräsentiert wie die operativen Proxys, die direkt daneben sitzen.

Abbildung 5·Öffentliche Leitlinie·vs.·Geleaktes Schema

Was Google benennt, ist nicht das, was Google misst.

Die öffentliche Leitlinie spricht über Qualitäten von Inhalten. Das geleakte Content-Warehouse-Schema fragt Eigenschaften von Sites ab. Andere Einheit, anderes Vokabular, und fast keine Überschneidung dem Namen nach.

Was Google sagt
Die vier Prinzipien hilfreicher InhalteSearch Quality Rater Guidelines, öffentlich
  1. E

    Experience

    Eigene Auseinandersetzung mit dem Thema aus erster Hand.

  2. E

    Expertise

    Tiefes, belegbares Wissen über das Thema.

  3. A

    Authoritativeness

    Anerkannte Autorität im Fachgebiet.

  4. T

    Trustworthiness

    Verlässlich, korrekt, transparent.

Was das Schema abfragt
Abfragbare Features auf Site-EbeneContent-Warehouse-API-Leak · März 2024
  • ·siteAuthorityscoreSite-weiter Autoritäts-Score, nicht thematisch.
  • ·chromeInTotalsignalChrome-Clickstream-Volumen auf Site-Ebene.
  • ·hostNsrscoreNormalisierter Site-Rank auf Host-Ebene.
  • ·siteFocusScorescoreWie thematisch fokussiert eine Site ist.
  • ·siteRadiusvectorEmbedding-Distanz vom Schwerpunkt der Site.
  • ·smallPersonalSiteflagHobby-Site-Klassifikatorumstritten
Search Quality Rater Guidelines · Search Liaison
Quellen
Google-Content-Warehouse-API-Leak, März 2024
Feature-Namen aus GoogleApi.ContentWarehouse.V1.Model.* Protobuf-Definitionen, die im Leak vom März 2024 offengelegt wurden. Diese Namen sind im geleakten Schema vorhanden, aber der Leak zeigt Attributdefinitionen, nicht bestätigte Live-Ranking-Gewichte.

Warum das Schema so aussieht

Google kann faktische Qualität in Web-Größenordnung nicht verifizieren. Kein Dienst innerhalb von Search ruft ein LLM auf, um zu fragen, ob die Autorin von „Wie es ist, einen Monat in Pattaya zu verbringen" tatsächlich einen Monat in Pattaya verbracht hat. Selbst bei aktuellen Inferenz-Preisen ist diese Prüfung über das indexierte Web hinweg unwirtschaftlich, und sie läge trotzdem in der Hälfte der Fälle daneben, weil das Modell auch keine Grundwahrheit hat. Das Verifikationsproblem ist strukturell, keine Tooling-Lücke, die bessere Modelle schließen.

Also tut Google, was jeder großskalige Ranker tut, wenn das, was er messen will, unmessbar ist: Er wählt Proxys. Beobachtbare Korrelate der Sache. Signale, die sich im Schnitt über ein großes Korpus mit Qualität mitbewegen, auch wenn jeder einzelne Fall verrauscht ist. Das ist kein Skandal. Es ist das einzige Design, das in dieser Größenordnung existiert.

Die Frage ist, welche Proxys. Und hier ist der Leak präzise, wo Googles öffentliche Botschaft vage ist. Die Proxys, die das Ranking auf Site-Ebene steuern, sind operative Signaturen: siteAuthority abgeleitet aus Qstar, chromeInTotal abgeleitet aus dem Browser-Clickstream-Volumen, hostNsr abgeleitet aus Sitechunk-Aggregaten, siteFocusScore und siteRadius abgeleitet aus Embedding-Distanzen. Darüber liegt die gut dokumentierte Entity-Infrastruktur: Knowledge-Graph-Verknüpfung, Markensuch-Volumen für navigationale Queries, Schema-Markup, anhaltende Erwähnungsgeschwindigkeit in News-Korpora. Die erforderlichen Inputs des gesamten Stacks skalieren alle mit operativer Infrastruktur, nicht damit, ob die Autorin im Raum war.

Bullisch gelesen: Diese Proxys korrelieren mit vertrauenswürdigen Verlagen, weil vertrauenswürdige Verlage dazu neigen, operative Infrastruktur aufzubauen. Eine Site, die seit einem Jahrzehnt läuft, in News zitiert wird, eine Knowledge-Graph-Verknüpfung hält und stetige Markensuche zeigt, hat sich diesen Fußabdruck im Schnitt verdient, indem sie verlässlich war. Der Proxy macht seine Arbeit.

Bearisch gelesen: Die Proxys messen kein Vertrauen. Sie messen die operative Signatur einer Entität, die das Personal, die Zeit und das Budget hat, um wie eine Marke auszusehen. Eine kleine Beratung mit einem PR-Retainer, einer als Unternehmen registrierten Domain, konsistentem NAP über Verzeichnisse hinweg, einem bezahlten Knowledge-Graph-Push und einem Content-Team, das eng geclustertes thematisches Material produziert, bekommt denselben Site-Score wie eine Publikation, die tatsächlich Fakten prüft. Beide Lesarten sind korrekt, und welche zählt, hängt davon ab, ob du nach der durchschnittlichen oder der marginalen Qualität fragst.

Der marginale Fall ist, wo der Widerspruch wohnt. Eine Einzelautorin mit Domänen-Erfahrung aus erster Hand (eine aktive Traderin, die über einen Markt schreibt, in dem sie lebt, ein Entwickler, der über ein Tool schreibt, das er gebaut hat, ein Elternteil, das über ein Schulsystem schreibt, das die Kinder besuchen) produziert per Definition genau die Art von Inhalt, die E-E-A-T belohnen sollte. Dieselbe Autorin kann die operative Signatur, die der Ranker tatsächlich konsumiert, nicht wirtschaftlich erzeugen. Sie hat kein PR-Budget, um News-Erwähnungen zu säen. Ihr NAP ist ein Name über eine persönliche Domain. Die Markensuche nach ihrem Namen liefert nahezu null navigationale Queries, weil noch niemand von ihr gehört hat. siteFocusScore liest sich niedrig, weil sie über die Themen schreibt, die ihr Leben tatsächlich kreuzt. chromeInTotal ist klein, weil sie keine Distribution hat. hostNsr mittelt niedrig, weil die Sitechunks von Essays aus erster Hand über Dokumentation von Nebenprojekten bis zu einem alten Vortrag reichen. Jedes dieser Signale kodiert „kleine persönliche Site" als „schwache Site" über denselben Proxy-Mechanismus. Das smallPersonalSite-Flag selbst ist eine separate Frage, und man sollte es nicht überinterpretieren. Seine Existenz beweist, dass „kleine persönliche Site" als interne repräsentationale Kategorie existiert, auf die der Ranking-Code aufsetzen kann. Sie beweist keinen Live-Demotion-Pfad: Der Leak sagt uns nicht, ob diese Kategorie boostet oder herabstuft, und manche veröffentlichten Lesarten interpretieren sie als ein Promotion-Signal für kleine Sites statt als Strafe.

Die operative Signatur aufzubauen ist kein Inhaltsproblem. Es ist ein Enterprise-Beschaffungsproblem. Knowledge-Graph-Einträge, anhaltende PR-Berichterstattung, Schema TravelAgency oder Schema NewsArticle, Volumen markengebundener navigationaler Queries: Das sind Posten in einem Marketing-Budget, keine Nebenprodukte guten Schreibens. Der Autor, der am meisten über Pattaya weiß, kann nicht gegen die Affiliate-Site ranken, die nie dort war, weil die Affiliate-Site das Beschaffungsbudget hat und der Autor nicht.

Die beiden Mechanismen zusammen

Geh jetzt mit beiden Mechanismen in der Hand zurück zu den zweigeteilten Daten.

Rezept-Sites überlebten (Mechanismus A) UND haben tendenziell starke operative Signaturen (Mechanismus B). Smitten Kitchen hat sechzehn Jahre sich aufschichtender Distribution, anhaltende Erwähnungsgeschwindigkeit in Food-Medien, wiederkehrenden Direkt-Traffic, Pinterest-Distribution. Die Kombination aus „AIO kann das Koch-Erlebnis nicht zusammenfassen" und „Smitten Kitchen hat die Infrastruktur, um unter den Überlebenden zu gewinnen" ergibt den Rückgang von −3,5 Prozent, den wir beobachtet haben.

How-To Geek verlor zuerst gegen Mechanismus A, die Queries, die es bediente, sind genau die Queries, die die HCU vom September 2023 herabstufte und die AIO später in drei Sätzen zu beantworten begann, aber seine operative Signatur reichte nicht, um den viel kleineren überlebenden Markt zu gewinnen. Daher die −93 Prozent.

Mr. Money Mustache überstand Mechanismus A jahrelang, da Privatfinanz-Philosophie nicht zusammenfassbar ist, verlor aber langsam gegen Mechanismus B (ein Autor, sich verengender Fokus, kein Enterprise-Content-Betrieb). Sein Zerfall zeigt sich als allmähliche Drift durch 2024 und Anfang 2025, gefolgt von einer diskreten Klippe im August 2025, die Form, die man von einem Core-Update erwarten würde, das Signale auf Site-Ebene neu gewichtet und asymmetrisch auf Ein-Autor-Sites niedergeht, mit dem Vorbehalt aus Abschnitt 2, dass das Timing im August 2025 ebenfalls verdächtig genug ist, um eine Prüfung über eine zweite Quelle zu rechtfertigen, bevor man es als reinen Algorithmus-Einschlag behandelt.

The World Pursuit verlor im Oktober 2023 gegen beide Mechanismen und hörte im Februar 2024 auf zu publizieren, was eine dritte Dynamik offenlegt: Wenn der Algorithmus die Break-even-Schwelle für die Ökonomie einer kleinen Site überschreitet, stellt die Site die Inhaltsproduktion ein, was dann das Urteil des Algorithmus selbstbestätigend macht. Das Signal smallPersonalSite war in diesem Fall ein Frühindikator für eine Site, die aufhören würde zu existieren.

Das ist die Architektur, die die Verlagsposition strukturell schwächer macht, als sie war. Mechanismus A entfernte eine ganze Inhaltskategorie aus der Klick-Ökonomie. Mechanismus B sorgte dafür, dass die verbleibende Inhaltskategorie an operative Entitäten ging statt an einzelne Experten. Abschnitt 3 zeigte, dass Google keinen finanziellen Anreiz hat, einen der beiden Mechanismen umzukehren. Der nächste Abschnitt zeigt, was sich im übrig gebliebenen Raum formt.

Der Lizenzmarkt, der sich im Schutt formt

Die Abschnitte 2 bis 4 handeln davon, was kaputt ist. Dieser Abschnitt handelt davon, was gebaut wird.

Die These: Während das Verlags-Ökosystem in der werbefinanzierten Klick-Ökonomie zerfällt, formt sich ein neuer Markt auf dem Modell der KI-Inhalts-Lizenzierung. Die Bausteine sind sichtbar. Sie wurden noch nicht zu einer Geschichte zusammengefügt.

Im Dezember 2023 unterschrieb Axel Springer einen mehrjährigen Deal mit OpenAI, der POLITICO, Business Insider, BILD und WELT abdeckt; eine Folgeberichterstattung von Axios bezifferte die Konditionen auf drei Jahre und zweistellige Millionenbeträge in Euro (die offizielle Ankündigung nannte keine Zahlen). Im selben Monat reichte NYT seine Klage gegen OpenAI und Microsoft ein und forderte Milliarden an Schadenersatz sowie die Vernichtung von Trainingsdatensätzen, die NYT-Inhalte enthalten. Zwei Monate später, im Februar 2024, berichtete Reuters, dass Reddit ein Lizenzabkommen über KI-Trainingsdaten mit Google für rund 60 Millionen Dollar pro Jahr unterzeichnet hatte. Im Mai 2024 unterzeichnete News Corp seinen eigenen Deal mit OpenAI, vom WSJ auf über 250 Millionen Dollar über fünf Jahre beziffert, der WSJ, Barron's, MarketWatch, NY Post, The Times (UK), The Sun und The Australian abdeckt. Zwei Monate danach, am 30. Juli 2024, startete Perplexity sein Publishers Program mit sechs Gründungspartnern (TIME, Der Spiegel, Fortune, Entrepreneur, Texas Tribune, WordPress.com), strukturiert als Umsatzbeteiligung, immer wenn Perplexity Geld aus Interaktionen verdient, die Partnerinhalte referenzieren.

Dann, am 1. Juli 2025, machte Cloudflare den strukturellsten Schritt von allen. Sie kippten die Voreinstellung für neue Domains darauf, KI-Crawler zu blockieren, und starteten einen Pay-per-Crawl-Markt, bepreist über HTTP 402. Ein Crawler trifft auf die Site eines Verlags, erhält 402 Payment Required, versucht es erneut mit einem crawler-exact-price-Header, der den vom Verlag genannten Preis anerkennt, und die Anfrage wird über RFC 9421 kryptografisch authentifiziert. Wie Matthew Prince es im Launch-Post formulierte, „Cloudflare, along with a majority of the world's leading publishers and AI companies, is changing the default to block AI crawlers unless they pay creators for their content."

Zeitleiste des Lizenzmarkts 2023-2026 mit strukturellen Mechanismen, die in drei Ebenen entstehen

Tritt von den einzelnen Deals zurück, und die Form ist klar. Drei strukturelle Mechanismen formen sich gleichzeitig:

  1. Enterprise-Lizenzierung an der Spitze des Marktes, News Corp, Axel Springer, Deals der AP-Klasse, bei denen KI-Unternehmen sieben- und achtstellige Jahresbeträge für pauschale Trainings- und Serving-Rechte zahlen.
  2. Umsatzbeteiligung in der Mitte, Perplexitys Programm, bei dem Verlage einen Anteil am Umsatz aus Interaktionen erhalten, die ihre Inhalte zitieren.
  3. Infrastruktur-Metering am Long Tail, Cloudflares HTTP-402-Schicht, die jede einzelne Crawler-Anfrage in eine bepreiste Transaktion verwandelt.

Das sind keine konkurrierenden Modelle. Es sind drei Preisebenen für denselben zugrunde liegenden Markt: von Menschen geschriebenes Signal, verkauft an LLM-Anbieter als Trainingsdaten und als RAG-Retrieval-Quelle. Die Enterprise-Ebene bedient die Verlage, die verhandeln können. Die Umsatzbeteiligungs-Ebene bedient die Mitte. Die Metering-Ebene kümmert sich um alle anderen.

Warum die Nachfrage nach menschlichem Signal bleibt, und warum die Lizenzierung den Median-Verlag trotzdem im Stich lassen könnte

Das Argument für Unausweichlichkeit ruht auf einem einzigen Stück empirischer Forschung, das technische Leser konkret kennen sollten. Im Mai 2023 stellten Shumailov, Shumaylov, Zhao, Gal, Papernot und Anderson The Curse of Recursion: Training on Generated Data Makes Models Forget auf arXiv. Im Juli 2024 veröffentlichte dasselbe Team die peer-reviewte Erweiterung in Nature unter dem Titel AI models collapse when trained on recursively generated data. Der Mechanismus, den sie beschreiben, Model Collapse, ist, dass aufeinanderfolgende Modellgenerationen, die auf Daten früherer Modellgenerationen trainiert wurden, statistische Treue verlieren. Die Ränder der Verteilung verschwinden. Die Outputs konvergieren zum Modus einer zunehmend verarmten generativen Verteilung.

Das Shumailov-Ergebnis belegt, dass LLM-Anbieter einer dauerhaften Nachfrage nach hochwertigem menschlichem oder menschlich kuratiertem Signal gegenüberstehen, rein synthetische Trainingsschleifen degradieren. Es beweist nicht, dass die Nachfrage nur über Lizenzierung gedeckt werden kann; kuratierte Mischungen aus synthetischen und menschlichen Daten, Distillation aus größeren Modellen und gefilterte Web-Crawls verringern das Collapse-Problem in der Praxis alle. Was es bedeutet, ist, dass laufender Zugang zu frischem menschlichem Signal ein struktureller Input ist und kein optionaler. Kombiniere das mit Cloudflare-artigem Metering, das zuvor kostenlosen Crawler-Zugang bepreist, mit dem offenen Web, das sich mit KI-generiertem Inhalt füllt, der den Frische-Test nicht besteht, und mit dem juristischen Risiko, das die NYT-Klage auf der Seite des einseitigen Scrapings aufbaut, und die Kosten, diese Nachfrage über unmonetarisiertes Scraping zu decken, beginnen relativ zu den Kosten der Lizenzierung zu steigen.

Es formt sich also ein Markt. Die Frage war nie „werden Verlage für Inhalts-Lizenzierung bezahlt?" Die Frage ist, welche Form die Zahlungen annehmen und in welchem Maßstab.

Auseinandersetzung mit dem stärksten Gegenargument

Das rigoroseste veröffentlichte Gegenargument zur Lizenzmarkt-These ist Nieman Labs Beitrag vom Dezember 2025, der argumentiert, es gebe für die meisten Verlage keinen nennenswerten Lizenzumsatz. Das Argument ist sowohl empirisch (die Zahlen von 2025 sind klein) als auch strukturell (KI-Firmen haben mehr Verhandlungsmacht als Verlage und müssen die meisten von ihnen vielleicht nie bezahlen, selbst wenn ein Markt existiert). Die empirische Seite stimmt zum Stand Ende 2025; der Lizenzumsatz für den Median-Verlag ist klein, und Cloudflares Pay-per-Crawl war sechs Monate alt, als Nieman publizierte.

Die strukturelle Seite ist die tragende. Niemans Lesart ist, dass die Verhandlungsmacht dauerhaft die KI-Anbieter begünstigt: Sie können zwischen Verlagen substituieren, auf bereits Gescraptem trainieren, mit der Zeit mit dünneren Daten operieren und nur die wenigen größten Verlage bezahlen, die den Zugang glaubhaft verweigern können. Meine Lesart ist, dass die Verhandlungsmacht genau die relevante Frage ist, und Infrastruktur wie Cloudflares Metering pro Domain sie verändert, indem sie die Option des Substituierens durch Scraping für jeden Verlag hinter dem Netzwerk entfernt. Ob diese Verschiebung im Verhandlungsumfeld sich in Umsatz übersetzt, der über die Spitzenebene hinausfließt, ist die eigentlich offene Frage, und sie ist empirisch für das Fenster 2026-2028. Die passende Analogie für die Hälfte „formt sich das?" der Frage ist das Hochskalieren eines Infrastruktur-Marktes: Stripe brauchte vom Gründungszeitpunkt mehrere Jahre bis zu nennenswertem Zahlungsvolumen, Visa brauchte zwei Jahrzehnte. Dass ein 18 Monate alter Pay-per-Crawl-Markt Ende 2025 noch nicht hochskaliert ist, ist mit neuen Infrastruktur-Märkten vereinbar, kein Beleg dafür, dass sich die Struktur nicht formen wird.

Das substanzielle Risiko, das Nieman markiert, ist real, aber ein anderes als das existenzielle: Der Lizenzmarkt könnte sich in einer Form bilden, die den Umsatz an der Spitzenebene konzentriert, ohne nach unten zu mittelgroßen oder unabhängigen Verlagen durchzufließen. Das ist ein Verteilungsproblem, kein Existenzproblem. Cloudflares Preisgestaltung pro Domain versucht, es auf der Infrastruktur-Seite anzugehen. Umsatzbeteiligungs-Programme wie das von Perplexity versuchen, es in der Mitte anzugehen. Ob diese Mechanismen genug skalieren, um unabhängige Verlage nennenswert zu vergüten, ist die eigentlich offene Frage, und es ist eine, die das Fenster 2026–2028 empirisch beantworten wird.

Was sich mit den Daten, die wir haben, sagen lässt: Die Ziel-Ebene, die Google auf der SERP gebaut hat, extrahiert jetzt strukturell Wert aus Verlagsinhalten ohne Vergütung, und die parallel gebaute KI-Lizenz-Infrastruktur ist der erste Mechanismus, der Inhalt zumindest teilweise zurück an die Quelle monetarisiert. Verlage, die 2026–2028 überleben, werden die sein, die auf der Angebotsseite dieses Marktes landen, mit der operativen Kapazität zu verhandeln oder zu fakturieren. Verlage, die nicht überleben, gehen durch dieselbe Tür hinaus (Mechanismus A und Mechanismus B aus Abschnitt 4), die die Klick-Ökonomie zugemacht hat.

Was diese These widerlegen würde

Ein Triangulationsargument verdient sich Vertrauen, indem es vorab sagt, was es brechen würde. Hier ist, was ich als Widerlegung akzeptieren würde, formuliert als Tests, die jeder mit Query-Level-GSC-Zugang durchführen könnte.

Wenn Antwort-Komprimierbarkeit wirklich der Mechanismus hinter Mechanismus A ist, dann sollten innerhalb einer einzigen Domain hoch komprimierbare URLs über das HCU-und-AIO-Fenster mehr organischen Traffic verlieren als niedrig komprimierbare URLs. Wenn sie mit derselben Rate zurückgehen, ist das Muster auf Nischen-Ebene, das ich als Komprimierbarkeit lese, in Wahrheit etwas anderes (etwa eine Strafe auf Domain-Ebene).

Wenn AIO Drift ist und keine Klippe am Launch-Datum, dann sollten Query-Level-GSC-Daten eine allmähliche CTR-Erosion zeigen, die der Ausweitung der AIO-Abdeckung folgt, keine Diskontinuität konzentriert auf den Mai 2024. Eine scharfe Stufe im Mai 2024 mit flacher CTR auf beiden Seiten würde die Lesart als Adoptions-Bremszug widerlegen.

Wenn operative Proxys (Mechanismus B) wirklich die Ergebnisse unter den Überlebenden entscheiden, dann sollten niedrig komprimierbare Inhalte auf Domains mit starker Marke dieselbe Art Inhalt auf Domains mit schwacher Marke und einzelnem Autor schlagen, bei gleicher Query-Intention. Wenn eine Ein-Autor-Site ohne operativen Fußabdruck für dieselben niedrig komprimierbaren Queries genauso gut rankt wie ein Markenbetrieb, dann tut Mechanismus B nicht die Arbeit, die ich behaupte.

Und die tragende ökonomische Behauptung: Wenn das, was starb, die Verweis-Subvention ist und nicht die Nachfrage nach Inhalt, dann sollte der Deal-Flow bei KI-Lizenzierung sich weiter nach unten in den Markt ausdehnen, während der Klick-Verweis-Traffic weiter fällt. Wenn sich der Klick-Verweis an mittelgroße Verlage 2026-2027 materiell erholt, ohne dass Google AIO oder AI Mode zurücknimmt, dann ist die These „das Ziel ist auf die SERP gewandert" falsch, und ich muss sie zurückziehen.

Was das strukturell bedeutet

Drei gleichzeitige Verschiebungen sind in den Daten oben dokumentiert. Sie sind nicht dieselbe Verschiebung. Sie verstärken einander, aber sie haben verschiedene Mechanismen und verschiedene Zeithorizonte.

Algorithmisch (Abschnitt 4): Die Proxy-Signale auf Site-Ebene, die das Ranking steuern, bevorteilen systematisch operative Infrastruktur gegenüber Inhalt aus erster Hand. Das smallPersonalSite-Flag existiert im geleakten Schema (Richtung umstritten). Kein firstHandExperience-Attribut taucht in der geleakten Fläche auf, wobei der Leak nach Googles eigenem Eingeständnis unvollständig ist. Konstruktionsbedingt konkurrieren Verlage mit einzelnen Autoren und kleinen Betrieben gegen operative Entitäten auf den Metriken, die der Algorithmus zu messen scheint.

Ökonomisch (Abschnitt 3): Googles Umsatz auf der Search-Linie wuchs durch dasselbe Fenster, in dem die Click-through-Rates der Verlage kollabierten. Der Search-Umsatz stieg, während die an Verlage geleiteten Klicks fielen, was nahelegt, dass die Monetarisierung pro Query auf Googles Seite stieg. Der finanzielle Anreiz, den Google hatte, das Verlags-Ökosystem zu erhalten (als Verlagsseiten das Ziel waren, auf das die Nutzer klickten), wurde wegkonstruiert, als AIO und AI Mode das Ziel auf die SERP verlegten. Search ist gesund für Google. Die Abhängigkeit der Verlage von Search ist das Gegenteil.

Infrastrukturell (Abschnitt 5): Der Markt für KI-Inhalts-Lizenzierung formt sich in drei Ebenen: Enterprise-Deals, Umsatzbeteiligung, Infrastruktur-Metering. Das Ergebnis von Shumailov et al. belegt, dass LLM-Anbieter eine dauerhafte Nachfrage nach frischem, von Menschen geschriebenem Signal haben. Das Fenster 2026–2028 wird Form und Maßstab des entstehenden Marktes bestimmen, mit dem Verteilungsproblem (fließt Umsatz über die Spitzenebene hinaus) als der substanziellen offenen Frage.

Was dauerhaft verloren ist, ist das Gleichgewicht der 2013er-Ära, in dem eine anonyme Domain Evergreen-Referenz-Inhalt publizieren, über die Zeit Links akkumulieren, über AdSense monetarisieren und als stabiles Geschäft in bescheidenem Maßstab operieren konnte. AI Overviews entfernte die Queries, die die Inhaltskategorie bediente. Proxy-Signale auf Site-Ebene entfernten den Ranking-Vorteil, den anonyme unabhängige Sites gegen operative Wettbewerber gehabt haben mögen. Der finanzielle Anreiz, der Google dazu gebracht hätte, dieses Gleichgewicht zu schützen, wurde um eine Ziel-Ebene herum umgebaut, die Google jetzt besitzt. Nichts davon kehrt sich um.

Was weiter funktioniert, ist Inhalt, bei dem sich das Engagement nicht zusammenfassen lässt, bei dem die Seite das ist, weswegen du gekommen bist. Rezepte, die du kochst. Lifestyle, den du liest. Langform-Analyse. Fotografische Inhalte. Persönliche Philosophie. Die Kategorien, die in den Daten aus Abschnitt 2 überlebten, sind die Kategorien, deren zugrunde liegende Queries nicht in drei Sätzen zusammenfassbar sind und deren Leser das Ziel wollen, nicht bloß die Antwort.

Was entsteht, ist Inhalts-Lizenzierung an KI-Anbieter als primäres Umsatzsubstrat, wobei der einzelne Seitenbesuch zum Rest wird. Die Verlage, die durch das Fenster 2026–2028 navigieren, sind die Verlage, die auf der Angebotsseite dieses Marktes landen, mit der operativen Kapazität zu fakturieren. Die Verlage, die das nicht tun, sind die Verlage, die durch Mechanismus A und Mechanismus B hinausgehen.

Der Blog als Produkt überlebt nur dort, wo sich das Engagement nicht zusammenfassen lässt. Der Blog als Geschäft überlebt nur dort, wo er die operative Infrastruktur eines Unternehmens hat (oder dessen Lizenzbeziehung). Die Mitte ist leer, und sie kommt nicht zurück.

Anhang: das Korpus

Die Auswahlmethode, schlicht benannt, damit du das Cherry-Picking-Risiko selbst beurteilen kannst. Ich begann mit einer Liste bekannter mittelgroßer Verlags-Sites über sechs Nischen, die im Fenster 2018-2022 aktiv waren und rankten, wählte nach Nischen-Vielfalt und schloss große Medienkonzerne aus. Einige wurden während der Datenerhebung getauscht, als die Ahrefs-Historie zu dünn war, um sie zu nutzen (thesimpledollar.com, verkauft und umgeleitet, wurde durch wisebread.com ersetzt). Die Liste war nicht vorregistriert, bevor ich die Ergebnisse sah, also behandle sie als konstruierte Gelegenheitsstichprobe, nicht als Zufallsziehung. Die Komprimierbarkeitsklasse ist nach Inhaltstyp zugewiesen, nicht nach Ergebnis, und das ist der Punkt: Sie ist eine Vorhersage, die unabhängig von der Rückgangszahl daneben getroffen wurde.

DomainNischeKomprimierbarkeitPeak → CurrentRückgangInflectionAnmerkung
nomadicmatt.comReisegemischt280K → 109K−61%2024-04
theblondeabroad.comReisegemischt57K → 61K+7%2023-12
expertvagabond.comReisegemischt159K → 3.6K−98%2022-10
neverendingfootsteps.comReiseniedrig63K → 181K+188%keineallmähliches Wachstum
adventurouskate.comReisegemischt86K → 148K+72%2024-10
theworldpursuit.comReisegemischt171K → 0.3K−100%2023-10aufgegeben Feb 2024
smittenkitchen.comRezepteniedrig221K → 213K−4%2025-03
pinchofyum.comRezepteniedrig2.5M → 2.0M−21%2024-10
minimalistbaker.comRezepteniedrig2.4M → 931K−61%2025-01dünne KI-gestützte Varianten vermutet
halfbakedharvest.comRezepteniedrig822K → 977K+19%2025-08
sallysbakingaddiction.comRezepteniedrig11.6M → 10.4M−10%2025-03
howtogeek.comTech-How-tohoch4.8M → 330K−93%2022-11Valnet-eigen
makeuseof.comTech-How-tohoch6.7M → 161K−98%2023-10Valnet-eigen
instructables.comTech-How-tohoch2.5M → 3.0M+23%keineAutodesk-eigen
beebom.comTech-How-tohoch2.3M → 6.2M+168%keineverdächtig; wahrscheinlich Ahrefs-Neukalibrierung
addictivetips.comTech-How-tohoch138K → 7K−95%2023-11hohe jüngste Volatilität
allfreesewing.comHobby-Handwerkhoch22K → 3.4K−84%2023-12Prime Publishing
crochetkim.comHobby-Handwerkhoch13K → 3.4K−74%2023-11
mrmoneymustache.comPrivatfinanzengemischt88K → 41K−53%2025-08späte Klippe, Zweitquellen-Prüfung ratsam
wisebread.comPrivatfinanzengemischt23K → 9K−61%2024-06
getrichslowly.orgPrivatfinanzengemischt8.7K → 8.6K−1%2023-01
frugalwoods.comPrivatfinanzengemischt2.8K → 1.3K−54%2025-06niedrige Baseline, verrauscht
budgetsaresexy.comPrivatfinanzengemischt3.1K → 4.4K+45%2024-10niedrige Baseline, verrauscht
cupofjo.comLifestyleniedrig56K → 39K−31%keine
apartmenttherapy.comLifestyleniedrig1.6M → 959K−39%2024-09größerer Markenbetrieb
designmom.comLifestyleniedrig7.0K → 6.3K−10%2025-11
alphamom.comLifestyleniedrig16.8K → 12.1K−28%2023-01

Daten: Ahrefs Site Explorer, monatliche weltweite Schätzungen zum organischen Traffic, gezogen am 23.05.2026. Peak = höchster 12-monatiger gleitender Durchschnitt vor August 2024. Current = Mittel von Februar bis April 2026. „Komprimierbarkeit" ist die Antwort-Komprimierbarkeitsklasse aus Abschnitt 4, nach Inhaltstyp zugewiesen. Die eine Spannung, die zu benennen sich lohnt: Hobby-Handwerk-Sites sind als hoch komprimierbar markiert (kostenlose Muster und How-to-Stitch-Inhalte sind weitgehend prozedural) und sie kollabierten tatsächlich, aber sie sind auch die kleinsten Sites im Korpus, ihr Rückgang ist also überdeterminiert: Beide Mechanismen zeigen in dieselbe Richtung, und die Daten können sie in diesem Maßstab nicht sauber trennen.

Diskussion

Hier gibt es keine Kommentarspalte. Diskussionen laufen auf X.

Weitere Artikel

Die Pizza-Day-Bitcoins verfolgen

Jedes Jahr dieselben Artikel. Kontrafaktische Bewertungen, das Roadtrip-Gerücht, die Mann-beißt-Pizza-Schlagzeile. Niemand verfolgt die echten Coins. Also habe ich es gemacht. Hier ist, was die Chain zeigt und was 'jene spezifischen Bitcoins' überhaupt bedeutet.