Wie ChatGPT, Google und Perplexity bezahlte Inhalte zitieren, ohne sie als solche zu kennzeichnen.
Wer ChatGPT nach der besten Krankenversicherung oder dem besten Familienauto fragt, erwartet neutrale Empfehlungen. Tatsächlich stützen sich die Antworten häufig auf Seiten mit Werbe- oder Affiliate-KennzeichnungiWerbe-Kennzeichnung („Anzeige", „Werbung"): Gesetzlich vorgeschriebene Kennzeichnung für bezahlte Werbeplatzierungen auf Verlags-Websites. Bei reichweitenstarken Verlagen werden vier- bis fünfstellige Beträge pro Platzierung gezahlt.
Affiliate-Kennzeichnung: Hinweis auf provisionspflichtige Links. Klickt eine Leserin auf einen Link und kauft anschließend ein Produkt, erhält der Verlag eine Beteiligung, typischerweise 3 bis 10 Prozent der Bestellsumme., die auf der Verlagsseite sichtbar ist, in der KI-Antwort aber fehlt. Diese Transparenzlücke haben wir mit rund 7.000 Vergleichsanfragen über 120 Produktkategorien analysiert. Das Resultat: Knapp jeder dritte deutschsprachige und jeder vierte englischsprachige Quellenverweis führt zu einer gekennzeichneten Seite. Die Nutzer erfahren davon nichts.
Um die Transparenzlücke zu messen, hat DataPulse Research mit BuzzView zusammengearbeitet, einer Analyseplattform für KI-Suche, die systematisch erfasst, worauf sich die Antworten führender KI-Tools tatsächlich stützen. Bereitgestellt wurden knapp 7.000 Vergleichs-Prompts nach dem Muster „beste/r [Produktkategorie]", etwa „beste Matratze", „bestes E-Auto für Familien", „beste Kfz-Versicherung" oder „bester VPN-Anbieter". Insgesamt deckten die Prompts 120 Kategorien ab. BuzzView hat sie an ChatGPT, Google AI Overview und Perplexity übermittelt und jede URL erfasst, die diese in ihren Antworten zitiert haben.
Anschließend wurden über 130.000 zitierte URLs mit einem Headless-Chromium-Browser geprüft (ein Browser ohne sichtbare Oberfläche, der per Skript Webseiten genauso lädt wie ein Nutzer, inklusive aller dynamisch nachgeladenen Werbe- und Affiliate-Elemente), um festzustellen, ob die zitierten Seiten Kennzeichen für kommerzielle Inhalte tragen, wie Werbe-Labels, Affiliate-Hinweise oder Hinweise auf Partner-Content.
Das Ergebnis: Rund 29 % der deutschsprachigen und 25 % der englischsprachigen Quellenverweise, die KI-Tools anzeigen, führen zu Seiten mit sichtbaren Kennzeichen für kommerzielle Inhalte. Im deutschsprachigen Datensatz tragen explizite Werbe-Kennzeichnungen (Typ A) und Affiliate-Hinweise (Typ B) etwa gleich stark zur Quote bei. Im englischsprachigen Datensatz dominieren Affiliate-Hinweise. Beide Formen kommerzieller Einflussnahme verschwinden, sobald KI-Systeme die Inhalte als Empfehlungen an ihre Leser neu verpacken.
Die hier untersuchten Verlagsseiten verbergen nichts: Ihre Kennzeichnungen sind im Originalkontext sichtbar. Sie legen ihre kommerziellen Beziehungen offen. Das Problem ist, dass die Transparenz verloren geht, wenn KI-Systeme die Empfehlungen daraus extrahieren.
Eine reale Produktfrage. Eine Verlagsseite, die ihre kommerzielle Beziehung sichtbar kennzeichnet. Drei KI-Tools, die diese Seite zitieren. Nirgendwo ein Hinweis auf den kommerziellen Ursprung der Empfehlung.
Die Focus.de-Seite trägt ein sichtbares „Anzeige"-Label und den gesetzlich vorgeschriebenen Sponsor-Hinweis. Nichts davon erreicht die Nutzer der KI-Tools.
handelsblatt.com
Die Handelsblatt-Seite trägt ein unverkennbares „Anzeige"-Banner. Alle drei KI-Tools zitieren sie dennoch, als handle es sich um unabhängigen redaktionellen Inhalt.
unternehmen.chip.de
Die am stärksten gekennzeichnete Seite im gesamten Datensatz — vier kommerzielle Kennzeichen — wird von den KI-Tools dennoch als neutrale Empfehlung zitiert.
Eine gesundheitsbezogene Anfrage. Die zitierten Seiten sind bezahlte Werbeartikel, geschaltet von Kliniken — in den KI-Antworten als neutrale medizinische Empfehlungen präsentiert.
Verlags-Websites müssen kommerzielle Inhalte kennzeichnen. Wie unsere Studie zeigt, gehen diese Kennzeichnungen oft verloren, sobald KI-Systeme diese Seiten zitieren. Nutzer sehen also eine Empfehlung, aber ohne Offenlegung ihrer kommerziellen Herkunft.
handelsblatt.com
ChatGPT
Der Verlag hat seinen Inhalt gekennzeichnet. Das KI-System übernimmt die Empfehlung, das Kennzeichen jedoch nicht. Die Nutzer erhalten eine kommerziell beeinflusste Empfehlung, ohne es zu wissen.
Knapp jeder dritte deutschsprachige und jeder vierte englischsprachige Quellenverweis, den KI-Tools für Produktanfragen anzeigen, führt zu einer Seite mit sichtbaren Kennzeichen für kommerzielle Inhalte. Wir unterscheiden drei Ebenen, auf denen kommerzieller Einfluss in KI-Empfehlungen einsickert.
Nach deutschem Recht (UWG, DDG, MStV)iDeutsche Werbe-Kennzeichnungsgesetze: UWG (Gesetz gegen den unlauteren Wettbewerb), DDG (Digitale-Dienste-Gesetz) und MStV (Medienstaatsvertrag). Sie verpflichten Verlage, kommerzielle Inhalte sichtbar zu kennzeichnen. müssen Verlage sämtliche kommerziellen Inhalte, einschließlich Affiliate-Beziehungen, mit Kennzeichen wie „Anzeige“ oder „Werbung“ versehen. Diese Kennzeichnungspflicht prägt im deutschsprachigen Datensatz sowohl explizite Werbe-Labels als auch Affiliate-Hinweise. Englischsprachige Verlage legen vor allem über Affiliate-Hinweise offen („we may earn a commission“, also etwa „wir erhalten ggf. eine Provision“), explizite Werbe-Labels sind dort deutlich seltener. Die niedrigere englischsprachige Quote ist deshalb primär regulatorisch bedingt: Ohne entsprechende Kennzeichnungspflicht laufen kommerzielle Beziehungen häufiger über Affiliate-Disclosures statt über sichtbare Werbe-Labels. Ob dort insgesamt mehr oder weniger versteckte Werbung existiert, lässt sich aus diesen Daten nicht ableiten, weil die Studie nur transparent gekennzeichnete Inhalte erfasst. In beiden Sprachräumen zitieren die KI-Tools die Inhalte, lassen Transparenzhinweise jedoch weg.
Anteil der Quellenverweise je Sprache, getrennt berechnet. Ein Quellenverweis kann mehrere Kennzeichen tragen, weshalb sich die drei Ebenen nicht exakt zur Gesamtquote addieren. Eine vierte, pfadbasierte Erkennung (bekannte kommerzielle URL-Pfade) ist in der Methodik dokumentiert.
Alle drei KI-Tools zeigen kommerziell finanzierte Inhalte in erheblichem Umfang an. Perplexity liegt mit 31,6 % der deutschsprachigen Quellenverweise an der Spitze, gefolgt von ChatGPT (28,0 %) und Google AI Overview (26,6 %). Dass alle drei nah beieinander liegen, deutet darauf hin, dass das Problem systemischer Natur ist, nicht tool-spezifisch. Die Gesamtquote von 29 % ist der nach Zitierhäufigkeit gewichtete Durchschnitt dieser drei Werte.
| Deutsch | Englisch | |
|---|---|---|
| Perplexity | 31,6 % | 30,9 % |
| ChatGPT | 28,0 % | 22,6 % |
| Google AI Overview | 26,6 % | 23,5 % |
Anteil kommerzieller Inhalte: Prozentsatz der von jedem Tool angezeigten Quellenverweise, die zu Seiten mit Werbe-Labels, Affiliate-Hinweisen oder Hinweisen auf Partner-Content führen.
Die Transparenzlücke wirft Fragen für verschiedene Akteure auf. Dies sind Beobachtungen, keine politischen Empfehlungen.
KI-generierte Produktempfehlungen können implizite kommerzielle Einflüsse enthalten, die in der Antwort nicht sichtbar werden. Auf der Oberfläche der KI-Antwort haben Nutzer keine Möglichkeit, kommerzielle von redaktionell neutralen Quellen zu unterscheiden, ohne jede einzelne zitierte Seite manuell zu prüfen.
Bestehende Werbekennzeichnungspflichten (etwa die deutschen „Anzeige"-Vorgaben) wurden für Verlags-Websites entwickelt, auf denen Kennzeichen sichtbar neben den Inhalten stehen. Sobald KI-Systeme diese Inhalte neu verpacken, klafft eine Regulierungslücke: Die Offenlegung existiert an der Quelle, fehlt aber an der Oberfläche, an der die Nutzer die Empfehlung tatsächlich konsumieren.
Verlage, die in ordnungsgemäße kommerzielle Offenlegungen investieren, sehen diese Kennzeichen verschwinden, sobald KI-Tools ihre Inhalte zitieren. Daraus ergibt sich ein paradoxer Effekt: Transparente Verlage verlieren ihre Offenlegungssignale, während nicht offengelegte kommerzielle Inhalte in KI-Zitaten keinerlei zusätzliche Benachteiligung erfahren.
KI-Anbieter stellen zitierte Quellen derzeit als gleichwertig dar. Ein Zitat aus einem rein redaktionellen Test und ein Zitat aus einem gekennzeichneten Werbeartikel erscheinen in der KI-Antwort identisch. Würden Quellen-Metadaten sichtbar gemacht, einschließlich des Status der kommerziellen Offenlegung, erhielten Nutzer den nötigen Kontext, um Empfehlungen einzuordnen.
Eine Reflexion über die Grenzen der Analyse ist zentral für die Einordnung des Ergebnisses. Die folgenden Punkte umreißen den Geltungsbereich.
Die 29 % beziehen sich auf einzelne Quellenverweise, nicht auf Anfragen. Von allen Quellen, die ChatGPT, Perplexity und Google AI Overview in ihren Antworten auf deutschsprachige Produktanfragen anzeigen, führen rund 29 % zu einer Seite mit kommerzieller Kennzeichnung.
Ein Beispiel: Zeigen die KI-Antworten zusammen 100 Quellenverweise an, sind davon etwa 29 kommerziell gekennzeichnet.
Zählt man stattdessen jede Webseite nur einmal – unabhängig davon, wie oft sie zitiert wird – liegt die Quote bei 25 %. Die 29 % bilden also ab, was Nutzer tatsächlich zu sehen bekommen; die 25 % beschreiben die Zusammensetzung der zugrunde liegenden Quellen.
Nahezu immer. Bei deutschsprachigen Produktanfragen enthielten 98,9 % aller KI-Antworten mindestens eine kommerziell gekennzeichnete Quelle (Perplexity 94,9 %, ChatGPT 94,2 %, Google AI Overview 86,9 %).
Der Grund liegt in der Menge: Eine einzelne Antwort stützt sich oft auf 20 und mehr Quellen. Bei einer Grundquote von rund einem Viertel ist mindestens ein kommerziell gekennzeichneter Treffer damit praktisch unvermeidlich.
Wer eine KI nach einer Produktempfehlung fragt, bekommt also fast garantiert mindestens eine kommerziell beeinflusste Quelle serviert – ohne es zu erfahren.
Nein. Ein Kennzeichen bedeutet, dass die Quelle eine kommerzielle Beziehung offenlegt – etwa eine bezahlte Platzierung oder einen Affiliate-Link. Die Empfehlung selbst kann inhaltlich völlig in Ordnung sein.
Der Punkt der Studie ist nicht, dass gekennzeichnete Inhalte schlecht sind, sondern dass Nutzer in der KI-Antwort nicht erfahren, dass eine kommerzielle Beziehung besteht – ein Hinweis, der auf der Originalseite sichtbar wäre.
Nein. Das Fehlen eines Kennzeichens heißt nur, dass keine kommerzielle Beziehung offengelegt wurde – nicht, dass keine besteht. Anbieter, die ihre Beziehungen nicht kennzeichnen, bleiben für unsere Messung unsichtbar.
Die ausgewiesenen Quoten sind deshalb eine Untergrenze: Der tatsächliche Anteil kommerziell beeinflusster Quellen dürfte höher liegen.
Nein, das behauptet die Studie nicht. Die untersuchten Verlage kennzeichnen ihre kommerziellen Inhalte korrekt, wie es das deutsche Recht verlangt.
Das Problem entsteht erst eine Ebene später: Bestehende Kennzeichnungspflichten wurden für Verlagsseiten entworfen, nicht für KI-Systeme, die diese Inhalte neu zusammenfassen. Dabei geht die Kennzeichnung verloren – eine Regulierungslücke, kein Rechtsbruch.
„Vertrauen“ ist dabei weniger die Frage als Transparenz. KI-Systeme sind keine unabhängigen Warentester; sie fassen vorhandene Webinhalte zusammen und übernehmen dabei auch Empfehlungen aus kommerziell finanzierten Quellen, ohne deren Kennzeichnung mit anzuzeigen.
Das heißt nicht, dass jede KI-Empfehlung schlecht ist – wohl aber, dass Nutzern der kommerzielle Kontext fehlt, der ihnen auf der Originalseite angezeigt würde. Ein kritischer Blick auf KI-generierte Kauf-Tipps – und ein Klick auf die zitierten Quellen – bleibt deshalb sinnvoll.
Vollständige technische Details zur Reproduzierbarkeit. Fragen zur Methodik beantworten wir gern unter presse@datapulse.de.
6.668 Prompts wurden nach dem Muster „beste/r [Produkt/Dienst]" für 120 Verbraucher- und B2B-Kategorien generiert, darunter Unterhaltungselektronik, Finanzen, Gesundheit und Wellness, Reisen und Hotellerie, B2B-Software (CRM, CMS, ERP, Marketing-Plattformen), Haushalt und Küche, Mode und Beauty, Fitness, Automobil, Haustiere und Online-Bildung. Zu jeder Kategorie gehörten mehrere Prompt-Varianten. Die Prompts wurden auf Deutsch (3.334) und Englisch (3.334) erstellt. Spanische Prompts wurden zwar erhoben, jedoch aufgrund eines zu geringen Zitiervolumens von der Analyse ausgeschlossen.
Die Prompts wurden über BuzzView an drei KI-Tools (Google AI Overview, ChatGPT, Perplexity) übermittelt. BuzzView ist eine kommerzielle Plattform zur Beobachtung von KI-Zitaten und wurde unabhängig von DataPulse entwickelt. Die Plattform extrahierte alle aus den KI-Antworten zitierten URLs und erfasste insgesamt 139.033 einzigartige URLs.
Jede URL wurde mit einem Headless-Chromium-Browser (Playwright) gescannt, um vollständiges JavaScript-Rendering sicherzustellen. Der Scanner analysierte sowohl den gerenderten DOM-Text als auch den rohen HTML-Quelltext. Von den 139.033 erhobenen URLs wurden alle gescannt; 132.335 (95,2 %) erfolgreich. Die übrigen 6.698 (4,8 %) lieferten aufgrund von Timeouts, geografischen Sperren oder Anti-Bot-Maßnahmen Fehler.
Der Scanner prüfte 22 Kennzeichen für kommerzielle Inhalte, organisiert in vier Ebenen:
Die Erkennung kombinierte exakten String-Abgleich, kontextbezogenes Pattern-Matching und DOM-Vorfahrenanalyse, um falsch-positive Treffer zu minimieren.
Die Entfernung falsch-positiver Treffer erfolgte in drei Stufen:
Das dreistufige Verfahren wurde gegen eine DOM-verifizierte Referenzwahrheit kalibriert. Ebene-B-Kennzeichen (Affiliate-Hinweise) erreichten eine Präzision von über 95 %. Ebene-A-Kennzeichen („Anzeige", „Werbung") wurden bei Mehrdeutigkeit einzeln DOM-verifiziert und erreichen nach der Filterung eine geschätzte Präzision von 85 bis 90 %. Ebene-C- und Ebene-D-Kennzeichen wurden durch manuelle Stichprobenprüfungen der Kontext-Strings validiert.
Zwei Bezugsgrößen. Die Hauptquoten (29 % DE / 25 % EN) zählen jeden angezeigten Quellenverweis; pro einzelner URL gezählt liegen sie bei 25 % bzw. 19 %. Berücksichtigt man auf dieser Per-URL-Basis zusätzlich die verbleibenden falsch-positiven Treffer, ergibt sich eine konservative Mindestquote von rund 22 % (DE) bzw. 17 % (EN).
Jeder Quellenverweis wurde über die BuzzView-Projekt-Exporte seiner Quellsprache zugeordnet (64.240 einzigartige deutschsprachige, 71.286 einzigartige englischsprachige URLs). URLs, die in beiden Sprachen zitiert werden, zählen in beide Summen. Die Sprachquoten beziehen sich auf alle Quellenverweise der jeweiligen Sprache. Über den gesamten Datensatz beträgt die kommerzielle Quote rund 27 % der Quellenverweise; zählt man jede der 128.294 ausgewerteten URLs nur einmal, sind es 21,3 % (27.347 kommerzielle URLs nach dreistufiger Filterung falsch-positiver Treffer).
Die Quoten je Ebene und Sprache wurden berechnet, indem die validierten Kennzeichen jeder URL ihrer jeweiligen Ebene zugeordnet wurden. Ein einzelner Quellenverweis kann Kennzeichen in mehreren Ebenen auslösen, weshalb sich die Ebenen-Quoten nicht zur Gesamtquote addieren. Nach Sprache getrennt verteilen sich die Ebenen wie folgt – Deutsch: Ebene A 12,0 %, Ebene B 14,0 %, Ebene C 7,1 %; Englisch: Ebene A 1,8 %, Ebene B 21,4 %, Ebene C 2,9 %.
Die KI-Zitationsdaten wurden im April 2026 über BuzzView erhoben. Die Verifikation falsch-positiver Treffer und die DOM-Vorfahrenanalyse wurden im April 2026 abgeschlossen.
Ich bin Gründer und CEO von DataPulse Research, einem kleinen Datenstudio in Berlin. Wir versuchen, gesellschaftliche Trends in Europa aufzuspüren, bevor sie allgemein bekannt sind. Mich treibt dabei eine kleine Obsession an: Dinge mit Daten und Visualisierungen in Perspektive zu rücken und komplexe Themen so aufzubereiten, dass sie greifbar und überprüfbar werden.
Als Senior Data Journalist bei DataPulse Research recherchiere, analysiere und visualisiere ich Daten, um faktenbasierte Geschichten zu erzählen, die in den Medien Resonanz finden. Mein Fokus liegt darauf, komplexe Datensätze in klare, zugängliche Narrative zu übersetzen, die aktuelle gesellschaftliche und wirtschaftliche Entwicklungen beleuchten. Mit über fünf Jahren Erfahrung in Datenanalyse und datengetriebenem Storytelling decke ich kritische Trends und Muster auf.
Impressum | Datenschutz | AGB
Copyright © 2026| All Rights Reserved by DataPulse | With ❤️ from Berlin
By signing up you agree to our privacy policy. Unsubscribe anytime.
You'll receive our next study straight to your inbox.
Mit der Anmeldung stimmst du unseren Datenschutzrichtlinien zu. Jederzeit abbestellbar.
Du bekommst unsere nächste Studie direkt in dein Postfach.