Diese Seite dokumentiert, wie wir die KI-Tarot-Lesungsdaten, die wir auf dieser Website veröffentlichen, erheben, anonymisieren und analysieren. Wir aktualisieren sie, wenn sich die Methodik ändert.

Zuletzt aktualisiert: 2026-05-06.

Zusammensetzung der Stichprobe

Unser aktueller Datensatz:

1.370 Lesungen insgesamt
~750 einzigartige Teilnehmer — zusammengesetzt aus:
- 69 registrierte Nutzer (definiert durch user_id; strenge Deduplizierung; 24% der Lesungen)
- ~680 anonyme Gastsitzungen (per IP-Fingerabdruck; 76% der Lesungen)
7 Sprachen (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
Zeitfenster: 2026-01-01 bis 2026-05-02
1.261 Lesungen mit Fragetext (der Rest sind "Ziehen ohne Frage"-Anfragen)

Wichtiger Vorbehalt: Gast-IP-Fingerabdrücke überzählen einzigartige Teilnehmer (mehrere Nutzer können eine IP teilen — Haushalt, Universität, Corporate-NAT) und unterschätzen wiederkehrende Nutzer (eine Person über mobile + Heim + Arbeits-IPs zählt als 3). ~750 ist eine grobe Größenordnung, keine genaue Zahl. Die 69 registrierten Nutzer sind exakt.

Der Datensatz wächst kontinuierlich. Quartalsweise Snapshots werden mit vollständigen Statistiken veröffentlicht. Echtzeit-Statistiken können vom veröffentlichten Snapshot um bis zu ein Quartal abweichen.

Was wir erfassen

Für jede Lesung protokolliert unsere Anwendung:

Feld	Typ	Zweck
Lesungs-ID	UUID	Eindeutige Kennung
Nutzer-ID-Hash	SHA-256	Anonymisierte Nutzergruppierung
Spread-Typ	enum	Welcher Spread (3-Karten, Celtic, etc.)
Gezogene Karten	Array von Karten-IDs	Reihenfolge relevant (Positionen)
Umkehr-Flags	Array von bool	Pro Karte
Fragetext	Text (optional)	Falls vom Nutzer angegeben
Fragekategorie	enum	Automatisch kategorisiert: Zukunft, Liebe, Arbeit, Geld, Gesundheit, Familie, unkategorisiert
Sprache	ISO 639-1	UI-Sprache zum Zeitpunkt der Lesung
Zeitstempel	UTC	Datum + Uhrzeit
KI-Modell	enum	gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3
Nutzerbewertung	1-5 (optional)	Feedback nach der Lesung, falls gegeben

Was wir nicht protokollieren: IP-Adresse (nur SHA-256-Hash zur Sicherheit), E-Mail, Name, physischen Standort über den Ländercode aus der IP-Geolokalisierung hinaus, Browser-Fingerabdrücke oder andere personenidentifizierende Daten.

Anonymisierungsprozess

Nutzer-IDs in veröffentlichten Statistiken sind SHA-256-Hashes mit einem Snapshot-spezifischen Salt. Hash-Kollisionen sind praktisch null (2^256 Hash-Raum, 69 Nutzer).

Für veröffentlichte Pro-Karten-Statistiken wenden wir k-Anonymität mit k=5 an:

Kombinationen aus (Sprache + Spread-Typ + Woche) mit weniger als 5 Beobachtungen werden vor der Veröffentlichung in übergeordnete Gruppierungen aggregiert
Einzelne Lesungs-IDs erscheinen nie in öffentlichen Datensätzen
Fragetext wird nur in aggregierten Kategoriezählungen veröffentlicht, nie im Wortlaut

Der vollständige Anonymisierungsaudit wird vor jeder quartalsweisen Veröffentlichung durchgeführt. Audit-Notizen sind im Datensatz-Download enthalten.

KI-Anbieterzuordnung

Lesungen werden mit einem von vier LLM-Anbietern generiert, abhängig von Nutzer-Tier und Warteschlangenstatus:

NVIDIA Llama 3.3 70B — Fallback für das kostenlose Tier (letzter Ausweg)
OpenRouter Gemini 2.5 Flash — primäres kostenloses Tier (≥90% der kostenlosen Lesungen)
OpenRouter Qwen3-235B — sekundäres kostenloses Tier
OpenRouter GPT-5.4 — bezahltes Tier 1 ("Seeker")-Lesungen
Anthropic Claude Sonnet 4.6 — bezahltes Tier 2 ("Mystic") Dual-Oracle-Lesungen

Die Pro-Lesung-KI-Anbieterzuordnung ist im Datensatz enthalten, damit Forscher das KI-Verhalten über Anbieter hinweg vergleichen können.

Statistische Grenzen

Drei Grenzen sind relevant:

Stichprobengröße. 1.370 Lesungen reichen aus, um starke Effekte zu erkennen (z.B. eine Abweichung von 50%+ vom Zufall), aber nicht für detaillierte Pro-Karten-Signifikanztests. Um zu behaupten, dass eine bestimmte Karte öfter erscheint als der Zufall erwarten würde, bräuchten wir nach der Standard-Chi-Quadrat-Stichprobengrößenberechnung für eine 78-Kategorien-Verteilung ungefähr 6.000 Lesungen. Wir sind etwa auf halbem Weg.

Auswahlverzerrung. Unsere Nutzer sind keine repräsentative Stichprobe aller Tarot-Nutzer weltweit. Sie sind Menschen, die:

aimag.me durch Suche, soziale Netzwerke oder Empfehlung gefunden haben
eine unserer unterstützten Sprachen sprechen
sich damit wohlfühlten, ein webbasiertes KI-Tarot-Tool zu nutzen
sich selbst in unseren Funnel eingewählt haben

Verallgemeinerungen auf "alle Tarot-Nutzer" sind aus diesem Datensatz nicht gerechtfertigt.

Beobachtend, nicht experimentell. Wir randomisieren nicht, wir haben keine Kontrollgruppe, wir können keine Kausalität herstellen. Wir können Muster beschreiben. Wir können nicht behaupten, sie zu erklären.

Aktualisierungsrhythmus

Quartalsweise Snapshots: Januar, April, Juli, Oktober. Veröffentlicht als versionierten Datensatz mit Anonymisierungsaudit-Notizen.
Echtzeit-Aggregatstatistiken: täglich auf dieser Website aktualisiert (Live-Zähler, Top-Karten, Wochentag-Verteilung).
Pro-Lesungs-Daten: nie in Echtzeit veröffentlicht. Immer in quartalsweise anonymisierte Snapshots gebündelt.

Interessenkonflikt

Der Autor dieser Forschung betreibt aimag.me, das KI-Tarot-Tool, aus dem diese Daten stammen. Das wird auf jeder Seite offengelegt. Wir haben ein finanzielles Interesse daran, dass Nutzer Tarot nützlich genug finden, um bezahlte Tiers zu abonnieren.

Um Verzerrungen durch diesen Konflikt zu minimieren:

Wir veröffentlichen Daten auch dann, wenn sie für KI-Tarot unvorteilhaft sind (z.B. untergräbt der Major:Minor-Zufallsbefund direkt mystische Behauptungen)
Wir verpflichten uns, alle quartalsweisen Snapshots zu veröffentlichen, unabhängig davon, was sie zeigen
Wir dokumentieren und erläutern Methodikänderungen, wenn sie auftreten
Der Datensatz selbst ist unter Creative-Commons-Lizenz offen — jeder kann seine eigene Analyse durchführen und unseren Interpretationen widersprechen

Lizenz

Auf dieser Website veröffentlichte Statistiken werden unter Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) veröffentlicht.

Zitatformat:

aimag.me Tarot Reading Dataset (n=1.370). Collected 2026-01-01 to 2026-05-02. Anonymized open dataset. Available at aimag.me/research.

Fragen

Für Methodikfragen, Datensatzzugangsanfragen oder Replikationsanfragen: [email protected].

Für RODO/DSGVO-bezogene Auskunftsersuchen beachte unsere Datenschutzrichtlinie.

Forschungsmethodik — Wie wir Tarot-Daten erheben und analysieren