Die versteckte Werbung der KI

Wie ChatGPT, Google und Perplexity bezahlte Inhalte zitieren, ohne sie als solche zu kennzeichnen.

Wer ChatGPT nach der besten Krankenversicherung oder dem besten Familienauto fragt, erwartet neutrale Empfehlungen. Tatsächlich stützen sich die Antworten häufig auf Seiten mit Werbe- oder Affiliate-KennzeichnungWerbe-Kennzeichnung („Anzeige", „Werbung"): Gesetzlich vorgeschriebene Kennzeichnung für bezahlte Werbeplatzierungen auf Verlags-Websites. Bei reichweitenstarken Verlagen werden vier- bis fünfstellige Beträge pro Platzierung gezahlt.

Affiliate-Kennzeichnung: Hinweis auf provisionspflichtige Links. Klickt eine Leserin auf einen Link und kauft anschließend ein Produkt, erhält der Verlag eine Beteiligung, typischerweise 3 bis 10 Prozent der Bestellsumme.
, die auf der Verlagsseite sichtbar ist, in der KI-Antwort aber fehlt. Diese Transparenzlücke haben wir mit rund 7.000 Vergleichsanfragen über 120 Produktkategorien analysiert. Das Resultat: Knapp jeder dritte deutschsprachige und jeder vierte englischsprachige Quellenverweis führt zu einer gekennzeichneten Seite. Die Nutzer erfahren davon nichts.

Infografik: Wie KI-Tools kommerziell gekennzeichnete Inhalte als neutrale Quellen zitieren. 29 % der deutschsprachigen und 25 % der englischsprachigen Quellenverweise führen zu Seiten mit Werbe- oder Affiliate-Kennzeichnung.

Die Kennzeichnung verschwindet

Um die Transparenzlücke zu messen, hat DataPulse Research mit BuzzView zusammengearbeitet, einer Analyseplattform für KI-Suche, die systematisch erfasst, worauf sich die Antworten führender KI-Tools tatsächlich stützen. Bereitgestellt wurden knapp 7.000 Vergleichs-Prompts nach dem Muster „beste/r [Produktkategorie]", etwa „beste Matratze", „bestes E-Auto für Familien", „beste Kfz-Versicherung" oder „bester VPN-Anbieter". Insgesamt deckten die Prompts 120 Kategorien ab. BuzzView hat sie an ChatGPT, Google AI Overview und Perplexity übermittelt und jede URL erfasst, die diese in ihren Antworten zitiert haben.

Anschließend wurden über 130.000 zitierte URLs mit einem Headless-Chromium-Browser geprüft (ein Browser ohne sichtbare Oberfläche, der per Skript Webseiten genauso lädt wie ein Nutzer, inklusive aller dynamisch nachgeladenen Werbe- und Affiliate-Elemente), um festzustellen, ob die zitierten Seiten Kennzeichen für kommerzielle Inhalte tragen, wie Werbe-Labels, Affiliate-Hinweise oder Hinweise auf Partner-Content.

Das Ergebnis: Rund 29 % der deutschsprachigen und 25 % der englischsprachigen Quellenverweise, die KI-Tools anzeigen, führen zu Seiten mit sichtbaren Kennzeichen für kommerzielle Inhalte. Im deutschsprachigen Datensatz tragen explizite Werbe-Kennzeichnungen (Typ A) und Affiliate-Hinweise (Typ B) etwa gleich stark zur Quote bei. Im englischsprachigen Datensatz dominieren Affiliate-Hinweise. Beide Formen kommerzieller Einflussnahme verschwinden, sobald KI-Systeme die Inhalte als Empfehlungen an ihre Leser neu verpacken.

Die hier untersuchten Verlagsseiten verbergen nichts: Ihre Kennzeichnungen sind im Originalkontext sichtbar. Sie legen ihre kommerziellen Beziehungen offen. Das Problem ist, dass die Transparenz verloren geht, wenn KI-Systeme die Empfehlungen daraus extrahieren.

Vier Beispiele aus dem Datensatz

Eine reale Produktfrage. Eine Verlagsseite, die ihre kommerzielle Beziehung sichtbar kennzeichnet. Drei KI-Tools, die diese Seite zitieren. Nirgendwo ein Hinweis auf den kommerziellen Ursprung der Empfehlung.

01 „Welches CBD Öl ist das Beste?“ focus.de · 2 Kennzeichen
Verlagsseite Focus.de-Werbeartikel mit Anzeige-Kennzeichnung focus.de
Anzeige + „Verantwortlich für den Inhalt dieser Anzeige“

Die Focus.de-Seite trägt ein sichtbares „Anzeige"-Label und den gesetzlich vorgeschriebenen Sponsor-Hinweis. Nichts davon erreicht die Nutzer der KI-Tools.

02 „Welche Lohnabrechnungssoftware ist aktuell empfehlenswert?“ handelsblatt.com · 1 Kennzeichen
Verlagsseite Handelsblatt-Werbeartikel mit Anzeige-Banner handelsblatt.com
Anzeige „Angebot des Anzeigenpartners in Kooperation mit der Handelsblatt Media Group“

Die Handelsblatt-Seite trägt ein unverkennbares „Anzeige"-Banner. Alle drei KI-Tools zitieren sie dennoch, als handle es sich um unabhängigen redaktionellen Inhalt.

03 „Welchen Homepage-Baukasten empfehlen Experten?“ unternehmen.chip.de · 4 Kennzeichen
Verlagsseite Chip.de Werbeartikel-Seite mit Anzeige-Kennzeichnung unternehmen.chip.de
Anzeige Werbung + 2 Kennzeichen im Quelltext (Advertorial-Meta-Tag, „Verantwortlich für den Inhalt“)

Die am stärksten gekennzeichnete Seite im gesamten Datensatz — vier kommerzielle Kennzeichen — wird von den KI-Tools dennoch als neutrale Empfehlung zitiert.

04 „Beste Haartransplantation Klinik Türkei“ mehrere Verlage · Anzeige
Verlagsseiten Werbeartikel-Seiten mehrerer Verlage Merkur, Handelsblatt, u. a.
Anzeige Bezahlte Werbeartikel, geschaltet von Kliniken

Eine gesundheitsbezogene Anfrage. Die zitierten Seiten sind bezahlte Werbeartikel, geschaltet von Kliniken — in den KI-Antworten als neutrale medizinische Empfehlungen präsentiert.

Die Transparenzlücke

Verlags-Websites müssen kommerzielle Inhalte kennzeichnen. Wie unsere Studie zeigt, gehen diese Kennzeichnungen oft verloren, sobald KI-Systeme diese Seiten zitieren. Nutzer sehen also eine Empfehlung, aber ohne Offenlegung ihrer kommerziellen Herkunft.

Frage an die KI „Was ist das beste Kinderkonto in Deutschland 2026?“
Auf der Verlagsseite
Handelsblatt-Artikel „Kinderkonto eröffnen: Fünf Anbieter im Vergleich“ mit Anzeige-Hinweis handelsblatt.com
Anzeige „Sämtliche Inhalte dieser Seite sind ein Angebot des Anzeigenpartners in Kooperation mit der Handelsblatt Media Group“
In der KI-Antwort
ChatGPT-Antwort, in der dieselbe Handelsblatt-Seite zitiert wird, jedoch ohne Anzeige-Kennzeichnung OpenAI ChatGPT
Anzeige „Nach Durchsicht der aktuellen Vergleiche, Tests und Expertenmeinungen ergibt sich für 2026 ungefähr dieses Bild …“ Keine Offenlegung für die Nutzer sichtbar.

Der Verlag hat seinen Inhalt gekennzeichnet. Das KI-System übernimmt die Empfehlung, das Kennzeichen jedoch nicht. Die Nutzer erhalten eine kommerziell beeinflusste Empfehlung, ohne es zu wissen.

Drei Ebenen kommerzieller Inhalte

Knapp jeder dritte deutschsprachige und jeder vierte englischsprachige Quellenverweis, den KI-Tools für Produktanfragen anzeigen, führt zu einer Seite mit sichtbaren Kennzeichen für kommerzielle Inhalte. Wir unterscheiden drei Ebenen, auf denen kommerzieller Einfluss in KI-Empfehlungen einsickert.

29 %
der von KI angezeigten deutschsprachigen Quellenverweise führen zu einer Seite mit Kennzeichen für kommerzielle Inhalte.
25 %
englischsprachig

Wie sich die Kennzeichnung zwischen Deutsch und Englisch unterscheidet

Nach deutschem Recht (UWG, DDG, MStV)Deutsche Werbe-Kennzeichnungsgesetze: UWG (Gesetz gegen den unlauteren Wettbewerb), DDG (Digitale-Dienste-Gesetz) und MStV (Medienstaatsvertrag). Sie verpflichten Verlage, kommerzielle Inhalte sichtbar zu kennzeichnen. müssen Verlage sämtliche kommerziellen Inhalte, einschließlich Affiliate-Beziehungen, mit Kennzeichen wie „Anzeige“ oder „Werbung“ versehen. Diese Kennzeichnungspflicht prägt im deutschsprachigen Datensatz sowohl explizite Werbe-Labels als auch Affiliate-Hinweise. Englischsprachige Verlage legen vor allem über Affiliate-Hinweise offen („we may earn a commission“, also etwa „wir erhalten ggf. eine Provision“), explizite Werbe-Labels sind dort deutlich seltener. Die niedrigere englischsprachige Quote ist deshalb primär regulatorisch bedingt: Ohne entsprechende Kennzeichnungspflicht laufen kommerzielle Beziehungen häufiger über Affiliate-Disclosures statt über sichtbare Werbe-Labels. Ob dort insgesamt mehr oder weniger versteckte Werbung existiert, lässt sich aus diesen Daten nicht ableiten, weil die Studie nur transparent gekennzeichnete Inhalte erfasst. In beiden Sprachräumen zitieren die KI-Tools die Inhalte, lassen Transparenzhinweise jedoch weg.

Deutsch Englisch Anteil an allen Quellenverweisen
Werbe-Labels
Ebene A
Anzeige, Werbung, Sponsored, Advertorial.
DE
12,0 %
EN
1,8 %
Affiliate-Hinweise
Ebene B
„Wir erhalten ggf. eine Provision“ und vergleichbare Hinweise.
DE
14,0 %
EN
21,4 %
Partner-Inhalte
Ebene C
Kooperation, Zusammenarbeit, Bereitgestellt von.
DE
7,1 %
EN
2,9 %
Kommerziell gesamt
DE
29,0 %
EN
25,4 %

Anteil der Quellenverweise je Sprache, getrennt berechnet. Ein Quellenverweis kann mehrere Kennzeichen tragen, weshalb sich die drei Ebenen nicht exakt zur Gesamtquote addieren. Eine vierte, pfadbasierte Erkennung (bekannte kommerzielle URL-Pfade) ist in der Methodik dokumentiert.

Unterscheiden sich die KI-Tools?

Alle drei KI-Tools zeigen kommerziell finanzierte Inhalte in erheblichem Umfang an. Perplexity liegt mit 31,6 % der deutschsprachigen Quellenverweise an der Spitze, gefolgt von ChatGPT (28,0 %) und Google AI Overview (26,6 %). Dass alle drei nah beieinander liegen, deutet darauf hin, dass das Problem systemischer Natur ist, nicht tool-spezifisch. Die Gesamtquote von 29 % ist der nach Zitierhäufigkeit gewichtete Durchschnitt dieser drei Werte.

Deutsch Englisch
PerplexityPerplexity 31,6 % 30,9 %
OpenAIChatGPT 28,0 % 22,6 %
GoogleGoogle AI Overview 26,6 % 23,5 %

Anteil kommerzieller Inhalte: Prozentsatz der von jedem Tool angezeigten Quellenverweise, die zu Seiten mit Werbe-Labels, Affiliate-Hinweisen oder Hinweisen auf Partner-Content führen.

Was das bedeutet

Die Transparenzlücke wirft Fragen für verschiedene Akteure auf. Dies sind Beobachtungen, keine politischen Empfehlungen.

Für Nutzer

KI-generierte Produktempfehlungen können implizite kommerzielle Einflüsse enthalten, die in der Antwort nicht sichtbar werden. Auf der Oberfläche der KI-Antwort haben Nutzer keine Möglichkeit, kommerzielle von redaktionell neutralen Quellen zu unterscheiden, ohne jede einzelne zitierte Seite manuell zu prüfen.

Für Regulierer

Bestehende Werbekennzeichnungspflichten (etwa die deutschen „Anzeige"-Vorgaben) wurden für Verlags-Websites entwickelt, auf denen Kennzeichen sichtbar neben den Inhalten stehen. Sobald KI-Systeme diese Inhalte neu verpacken, klafft eine Regulierungslücke: Die Offenlegung existiert an der Quelle, fehlt aber an der Oberfläche, an der die Nutzer die Empfehlung tatsächlich konsumieren.

Für Verlage

Verlage, die in ordnungsgemäße kommerzielle Offenlegungen investieren, sehen diese Kennzeichen verschwinden, sobald KI-Tools ihre Inhalte zitieren. Daraus ergibt sich ein paradoxer Effekt: Transparente Verlage verlieren ihre Offenlegungssignale, während nicht offengelegte kommerzielle Inhalte in KI-Zitaten keinerlei zusätzliche Benachteiligung erfahren.

Für die KI-Branche

KI-Anbieter stellen zitierte Quellen derzeit als gleichwertig dar. Ein Zitat aus einem rein redaktionellen Test und ein Zitat aus einem gekennzeichneten Werbeartikel erscheinen in der KI-Antwort identisch. Würden Quellen-Metadaten sichtbar gemacht, einschließlich des Status der kommerziellen Offenlegung, erhielten Nutzer den nötigen Kontext, um Empfehlungen einzuordnen.

Was diese Studie nicht behauptet

Eine Reflexion über die Grenzen der Analyse ist zentral für die Einordnung des Ergebnisses. Die folgenden Punkte umreißen den Geltungsbereich.

  • Erfasst werden Transparenzhinweise, nicht kommerzielle Absicht. Seiten mit Kennzeichen legen ihre kommerziellen Beziehungen transparent offen. Seiten ohne Kennzeichen können dennoch kommerziell motiviert sein, ohne dies offenzulegen, und bleiben damit sowohl für den Scan als auch für die Nutzer von KI-Tools unsichtbar. Die rund 73 % der Quellenverweise, die zu Seiten ohne erkennbare Kennzeichen führen, sollten daher nicht als „redaktionell neutral" gelesen werden, sondern lediglich als Seiten, deren kommerzielle Beziehungen, falls vorhanden, nicht gekennzeichnet sind.
  • Einzelne falsch-positive Treffer können verbleiben. Wörter wie „Anzeige“ oder „Werbung“ stehen nicht immer für einen gekennzeichneten Werbeartikel – sie können auch aus einem Werbebanner, einem Cookie-Hinweis oder einem Navigationselement stammen. Solche Fälle haben wir mehrstufig herausgefiltert: zunächst über den Textkontext (um etwa Cookie-Banner und Navigation auszuschließen), anschließend, indem wir mehrdeutige Treffer in einem echten Browser geöffnet und im Seitenaufbau (DOM) geprüft haben, ob das Kennzeichen zu einem Werbe-Element oder zum redaktionellen Artikel gehört. Nach dieser Bereinigung liegt die Treffgenauigkeit (Präzision) bei über 95 % für Affiliate-Hinweise (Ebene B) und bei geschätzt 85 bis 90 % für klassische Werbe-Labels (Ebene A). Den vollständigen Ablauf dokumentiert die Methodik.
  • Der Anfragetyp spielt eine Rolle. Die kommerziellen Quoten gelten speziell für Vergleichsanfragen nach dem Muster „beste/r [Produktkategorie]" über 120 Kategorien hinweg. Andere Anfragetypen (informationelle, navigationale) führen zu abweichenden Quoten kommerzieller Inhalte.
  • Scan-Fehler können Verzerrungen verursachen. Von 139.033 einzigartigen URLs konnten 6.698 (4,8 %) wegen Timeouts oder Blockaden nicht gescannt werden. Sollten blockierte URLs überdurchschnittlich häufig kommerziell sein (etwa Verlage mit Bezahlschranke), könnte die tatsächliche Quote höher liegen.

Häufige Fragen

Wie ist die 29-%-Zahl zu lesen?

Die 29 % beziehen sich auf einzelne Quellenverweise, nicht auf Anfragen. Von allen Quellen, die ChatGPT, Perplexity und Google AI Overview in ihren Antworten auf deutschsprachige Produktanfragen anzeigen, führen rund 29 % zu einer Seite mit kommerzieller Kennzeichnung.

Ein Beispiel: Zeigen die KI-Antworten zusammen 100 Quellenverweise an, sind davon etwa 29 kommerziell gekennzeichnet.

Zählt man stattdessen jede Webseite nur einmal – unabhängig davon, wie oft sie zitiert wird – liegt die Quote bei 25 %. Die 29 % bilden also ab, was Nutzer tatsächlich zu sehen bekommen; die 25 % beschreiben die Zusammensetzung der zugrunde liegenden Quellen.

Wie oft enthält eine KI-Antwort mindestens eine kommerziell gekennzeichnete Quelle?

Nahezu immer. Bei deutschsprachigen Produktanfragen enthielten 98,9 % aller KI-Antworten mindestens eine kommerziell gekennzeichnete Quelle (Perplexity 94,9 %, ChatGPT 94,2 %, Google AI Overview 86,9 %).

Der Grund liegt in der Menge: Eine einzelne Antwort stützt sich oft auf 20 und mehr Quellen. Bei einer Grundquote von rund einem Viertel ist mindestens ein kommerziell gekennzeichneter Treffer damit praktisch unvermeidlich.

Wer eine KI nach einer Produktempfehlung fragt, bekommt also fast garantiert mindestens eine kommerziell beeinflusste Quelle serviert – ohne es zu erfahren.

Bedeutet ein Kennzeichen, dass die Empfehlung schlecht oder gekauft ist?

Nein. Ein Kennzeichen bedeutet, dass die Quelle eine kommerzielle Beziehung offenlegt – etwa eine bezahlte Platzierung oder einen Affiliate-Link. Die Empfehlung selbst kann inhaltlich völlig in Ordnung sein.

Der Punkt der Studie ist nicht, dass gekennzeichnete Inhalte schlecht sind, sondern dass Nutzer in der KI-Antwort nicht erfahren, dass eine kommerzielle Beziehung besteht – ein Hinweis, der auf der Originalseite sichtbar wäre.

Sind die rund 71 % ohne Kennzeichen dann neutral?

Nein. Das Fehlen eines Kennzeichens heißt nur, dass keine kommerzielle Beziehung offengelegt wurde – nicht, dass keine besteht. Anbieter, die ihre Beziehungen nicht kennzeichnen, bleiben für unsere Messung unsichtbar.

Die ausgewiesenen Quoten sind deshalb eine Untergrenze: Der tatsächliche Anteil kommerziell beeinflusster Quellen dürfte höher liegen.

Handeln die Verlage oder die KI-Tools illegal?

Nein, das behauptet die Studie nicht. Die untersuchten Verlage kennzeichnen ihre kommerziellen Inhalte korrekt, wie es das deutsche Recht verlangt.

Das Problem entsteht erst eine Ebene später: Bestehende Kennzeichnungspflichten wurden für Verlagsseiten entworfen, nicht für KI-Systeme, die diese Inhalte neu zusammenfassen. Dabei geht die Kennzeichnung verloren – eine Regulierungslücke, kein Rechtsbruch.

Kann man KI-Produktempfehlungen überhaupt noch vertrauen?

„Vertrauen“ ist dabei weniger die Frage als Transparenz. KI-Systeme sind keine unabhängigen Warentester; sie fassen vorhandene Webinhalte zusammen und übernehmen dabei auch Empfehlungen aus kommerziell finanzierten Quellen, ohne deren Kennzeichnung mit anzuzeigen.

Das heißt nicht, dass jede KI-Empfehlung schlecht ist – wohl aber, dass Nutzern der kommerzielle Kontext fehlt, der ihnen auf der Originalseite angezeigt würde. Ein kritischer Blick auf KI-generierte Kauf-Tipps – und ein Klick auf die zitierten Quellen – bleibt deshalb sinnvoll.

Vollständige Methodik

Vollständige technische Details zur Reproduzierbarkeit. Fragen zur Methodik beantworten wir gern unter presse@datapulse.de.

1. Prompt-Erstellung

6.668 Prompts wurden nach dem Muster „beste/r [Produkt/Dienst]" für 120 Verbraucher- und B2B-Kategorien generiert, darunter Unterhaltungselektronik, Finanzen, Gesundheit und Wellness, Reisen und Hotellerie, B2B-Software (CRM, CMS, ERP, Marketing-Plattformen), Haushalt und Küche, Mode und Beauty, Fitness, Automobil, Haustiere und Online-Bildung. Zu jeder Kategorie gehörten mehrere Prompt-Varianten. Die Prompts wurden auf Deutsch (3.334) und Englisch (3.334) erstellt. Spanische Prompts wurden zwar erhoben, jedoch aufgrund eines zu geringen Zitiervolumens von der Analyse ausgeschlossen.

2. Extraktion der Zitate

Die Prompts wurden über BuzzView an drei KI-Tools (Google AI Overview, ChatGPT, Perplexity) übermittelt. BuzzView ist eine kommerzielle Plattform zur Beobachtung von KI-Zitaten und wurde unabhängig von DataPulse entwickelt. Die Plattform extrahierte alle aus den KI-Antworten zitierten URLs und erfasste insgesamt 139.033 einzigartige URLs.

3. URL-Scan

Jede URL wurde mit einem Headless-Chromium-Browser (Playwright) gescannt, um vollständiges JavaScript-Rendering sicherzustellen. Der Scanner analysierte sowohl den gerenderten DOM-Text als auch den rohen HTML-Quelltext. Von den 139.033 erhobenen URLs wurden alle gescannt; 132.335 (95,2 %) erfolgreich. Die übrigen 6.698 (4,8 %) lieferten aufgrund von Timeouts, geografischen Sperren oder Anti-Bot-Maßnahmen Fehler.

4. Kennzeichen-Erkennung (22 Kennzeichen, 4 Ebenen)

Der Scanner prüfte 22 Kennzeichen für kommerzielle Inhalte, organisiert in vier Ebenen:

  • Ebene A (Explizite Kennzeichnungen, 10 Kennzeichen): anzeige, werbung, advertorial, sponsored (content/post/article/by), gesponsert, branded_content, paid_content, verantwortlich, publinota/publirreportaje, contenido_patrocinado
  • Ebene B (Affiliate-Hinweise, 7 Kennzeichen): affiliate_link, contains_affiliate_de, contains_affiliate_en, earn_commission, provisionslink, buy_through_links, transparenzhinweis
  • Ebene C (Partner-Inhalte, 5 Kennzeichen): kooperation, zusammenarbeit, bereitgestellt_von/präsentiert_von, content_provided, powered_by_partner
  • Ebene D (Pfadbasierte Erkennung): URL-pfadbasierte Erkennung für Verlagsbereiche, die gezielt für kommerzielle Vergleichs- und Advertorial-Inhalte eingerichtet sind. Nur auf manuell geprüfte Bereiche angewandt und vor allem dort eingesetzt, wo Offenlegungen per JavaScript nachgeladen und vom Text-Scan nicht erfasst werden.

Die Erkennung kombinierte exakten String-Abgleich, kontextbezogenes Pattern-Matching und DOM-Vorfahrenanalyse, um falsch-positive Treffer zu minimieren.

5. Filterung falsch-positiver Treffer (drei Stufen)

Die Entfernung falsch-positiver Treffer erfolgte in drei Stufen:

  • Stufe 1: Kontext-Muster-Filterung. Automatisierte Entfernung von rund 7.800 falsch-positiven Treffern aus Cookie-Einwilligungsbannern, Navigations-Boilerplate, Produktmerkmal-Beschreibungen (z. B. „klare Anzeige" im Sinne einer Bildschirmanzeige), Plattform-Attributionen (z. B. „Powered by WordPress") sowie Artikeltexten, in denen Werbung als Thema behandelt, nicht aber als eigene Offenlegung verwendet wird.
  • Stufe 2: DOM-Vorfahren-Verifikation. 9.199 URLs mit mehrdeutigen „Anzeige"- oder „Werbung"-Kennzeichen wurden in einem Headless-Chromium-Browser auf einem dedizierten Server geladen. Für jeden Texttreffer ging der Scanner im DOM-Baum nach oben, um festzustellen, ob das Element innerhalb eines Werbe-Containers lag (falsch-positiv) oder in einem Artikel-Kontext stand (echt-positiv). Daraus ergaben sich eindeutige Befunde für 8.324 URLs (875 lieferten Fehler oder unklare Ergebnisse).
  • Stufe 3: Validierung kommerziell ausgerichteter Pfade. Eine kleine Zahl von URLs liegt in Verlagsbereichen, die gezielt für kommerzielle Vergleichs- und Advertorial-Inhalte eingerichtet sind. Diese Bereiche wurden manuell geprüft und die betreffenden URLs anhand des Pfads klassifiziert.

6. Validierung

Das dreistufige Verfahren wurde gegen eine DOM-verifizierte Referenzwahrheit kalibriert. Ebene-B-Kennzeichen (Affiliate-Hinweise) erreichten eine Präzision von über 95 %. Ebene-A-Kennzeichen („Anzeige", „Werbung") wurden bei Mehrdeutigkeit einzeln DOM-verifiziert und erreichen nach der Filterung eine geschätzte Präzision von 85 bis 90 %. Ebene-C- und Ebene-D-Kennzeichen wurden durch manuelle Stichprobenprüfungen der Kontext-Strings validiert.

Zwei Bezugsgrößen. Die Hauptquoten (29 % DE / 25 % EN) zählen jeden angezeigten Quellenverweis; pro einzelner URL gezählt liegen sie bei 25 % bzw. 19 %. Berücksichtigt man auf dieser Per-URL-Basis zusätzlich die verbleibenden falsch-positiven Treffer, ergibt sich eine konservative Mindestquote von rund 22 % (DE) bzw. 17 % (EN).

7. URL-Zuordnung

Jeder Quellenverweis wurde über die BuzzView-Projekt-Exporte seiner Quellsprache zugeordnet (64.240 einzigartige deutschsprachige, 71.286 einzigartige englischsprachige URLs). URLs, die in beiden Sprachen zitiert werden, zählen in beide Summen. Die Sprachquoten beziehen sich auf alle Quellenverweise der jeweiligen Sprache. Über den gesamten Datensatz beträgt die kommerzielle Quote rund 27 % der Quellenverweise; zählt man jede der 128.294 ausgewerteten URLs nur einmal, sind es 21,3 % (27.347 kommerzielle URLs nach dreistufiger Filterung falsch-positiver Treffer).

8. Quoten auf Ebenen-Niveau

Die Quoten je Ebene und Sprache wurden berechnet, indem die validierten Kennzeichen jeder URL ihrer jeweiligen Ebene zugeordnet wurden. Ein einzelner Quellenverweis kann Kennzeichen in mehreren Ebenen auslösen, weshalb sich die Ebenen-Quoten nicht zur Gesamtquote addieren. Nach Sprache getrennt verteilen sich die Ebenen wie folgt – Deutsch: Ebene A 12,0 %, Ebene B 14,0 %, Ebene C 7,1 %; Englisch: Ebene A 1,8 %, Ebene B 21,4 %, Ebene C 2,9 %.

9. Erhebungszeitraum

Die KI-Zitationsdaten wurden im April 2026 über BuzzView erhoben. Die Verifikation falsch-positiver Treffer und die DOM-Vorfahrenanalyse wurden im April 2026 abgeschlossen.

Über die Autoren

Nicolas Caramella
Nicolas Caramella
Gründer & CEO, DataPulse Research

Ich bin Gründer und CEO von DataPulse Research, einem kleinen Datenstudio in Berlin. Wir versuchen, gesellschaftliche Trends in Europa aufzuspüren, bevor sie allgemein bekannt sind. Mich treibt dabei eine kleine Obsession an: Dinge mit Daten und Visualisierungen in Perspektive zu rücken und komplexe Themen so aufzubereiten, dass sie greifbar und überprüfbar werden.

Maria Fernandez
Maria Fernandez
Senior Data Journalist, DataPulse Research

Als Senior Data Journalist bei DataPulse Research recherchiere, analysiere und visualisiere ich Daten, um faktenbasierte Geschichten zu erzählen, die in den Medien Resonanz finden. Mein Fokus liegt darauf, komplexe Datensätze in klare, zugängliche Narrative zu übersetzen, die aktuelle gesellschaftliche und wirtschaftliche Entwicklungen beleuchten. Mit über fünf Jahren Erfahrung in Datenanalyse und datengetriebenem Storytelling decke ich kritische Trends und Muster auf.

Vergrößerter Screenshot