Diese Seite dokumentiert, wie wir die KI-Tarot-Lesungsdaten, die wir auf dieser Website veröffentlichen, erheben, anonymisieren und analysieren. Wir aktualisieren sie, wenn sich die Methodik ändert.
Zuletzt aktualisiert: 2026-05-06.
Zusammensetzung der Stichprobe
Unser aktueller Datensatz:
- 1.370 Lesungen insgesamt
- ~750 einzigartige Teilnehmer — zusammengesetzt aus:
- 69 registrierte Nutzer (definiert durch user_id; strenge Deduplizierung; 24% der Lesungen)
- ~680 anonyme Gastsitzungen (per IP-Fingerabdruck; 76% der Lesungen)
- 7 Sprachen (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
- Zeitfenster: 2026-01-01 bis 2026-05-02
- 1.261 Lesungen mit Fragetext (der Rest sind "Ziehen ohne Frage"-Anfragen)
Wichtiger Vorbehalt: Gast-IP-Fingerabdrücke überzählen einzigartige Teilnehmer (mehrere Nutzer können eine IP teilen — Haushalt, Universität, Corporate-NAT) und unterschätzen wiederkehrende Nutzer (eine Person über mobile + Heim + Arbeits-IPs zählt als 3). ~750 ist eine grobe Größenordnung, keine genaue Zahl. Die 69 registrierten Nutzer sind exakt.
Der Datensatz wächst kontinuierlich. Quartalsweise Snapshots werden mit vollständigen Statistiken veröffentlicht. Echtzeit-Statistiken können vom veröffentlichten Snapshot um bis zu ein Quartal abweichen.
Was wir erfassen
Für jede Lesung protokolliert unsere Anwendung:
| Feld | Typ | Zweck |
|---|---|---|
| Lesungs-ID | UUID | Eindeutige Kennung |
| Nutzer-ID-Hash | SHA-256 | Anonymisierte Nutzergruppierung |
| Spread-Typ | enum | Welcher Spread (3-Karten, Celtic, etc.) |
| Gezogene Karten | Array von Karten-IDs | Reihenfolge relevant (Positionen) |
| Umkehr-Flags | Array von bool | Pro Karte |
| Fragetext | Text (optional) | Falls vom Nutzer angegeben |
| Fragekategorie | enum | Automatisch kategorisiert: Zukunft, Liebe, Arbeit, Geld, Gesundheit, Familie, unkategorisiert |
| Sprache | ISO 639-1 | UI-Sprache zum Zeitpunkt der Lesung |
| Zeitstempel | UTC | Datum + Uhrzeit |
| KI-Modell | enum | gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3 |
| Nutzerbewertung | 1-5 (optional) | Feedback nach der Lesung, falls gegeben |
Was wir nicht protokollieren: IP-Adresse (nur SHA-256-Hash zur Sicherheit), E-Mail, Name, physischen Standort über den Ländercode aus der IP-Geolokalisierung hinaus, Browser-Fingerabdrücke oder andere personenidentifizierende Daten.
Anonymisierungsprozess
Nutzer-IDs in veröffentlichten Statistiken sind SHA-256-Hashes mit einem Snapshot-spezifischen Salt. Hash-Kollisionen sind praktisch null (2^256 Hash-Raum, 69 Nutzer).
Für veröffentlichte Pro-Karten-Statistiken wenden wir k-Anonymität mit k=5 an:
- Kombinationen aus (Sprache + Spread-Typ + Woche) mit weniger als 5 Beobachtungen werden vor der Veröffentlichung in übergeordnete Gruppierungen aggregiert
- Einzelne Lesungs-IDs erscheinen nie in öffentlichen Datensätzen
- Fragetext wird nur in aggregierten Kategoriezählungen veröffentlicht, nie im Wortlaut
Der vollständige Anonymisierungsaudit wird vor jeder quartalsweisen Veröffentlichung durchgeführt. Audit-Notizen sind im Datensatz-Download enthalten.
KI-Anbieterzuordnung
Lesungen werden mit einem von vier LLM-Anbietern generiert, abhängig von Nutzer-Tier und Warteschlangenstatus:
- NVIDIA Llama 3.3 70B — Fallback für das kostenlose Tier (letzter Ausweg)
- OpenRouter Gemini 2.5 Flash — primäres kostenloses Tier (≥90% der kostenlosen Lesungen)
- OpenRouter Qwen3-235B — sekundäres kostenloses Tier
- OpenRouter GPT-5.4 — bezahltes Tier 1 ("Seeker")-Lesungen
- Anthropic Claude Sonnet 4.6 — bezahltes Tier 2 ("Mystic") Dual-Oracle-Lesungen
Die Pro-Lesung-KI-Anbieterzuordnung ist im Datensatz enthalten, damit Forscher das KI-Verhalten über Anbieter hinweg vergleichen können.
Statistische Grenzen
Drei Grenzen sind relevant:
Stichprobengröße. 1.370 Lesungen reichen aus, um starke Effekte zu erkennen (z.B. eine Abweichung von 50%+ vom Zufall), aber nicht für detaillierte Pro-Karten-Signifikanztests. Um zu behaupten, dass eine bestimmte Karte öfter erscheint als der Zufall erwarten würde, bräuchten wir nach der Standard-Chi-Quadrat-Stichprobengrößenberechnung für eine 78-Kategorien-Verteilung ungefähr 6.000 Lesungen. Wir sind etwa auf halbem Weg.
Auswahlverzerrung. Unsere Nutzer sind keine repräsentative Stichprobe aller Tarot-Nutzer weltweit. Sie sind Menschen, die:
- aimag.me durch Suche, soziale Netzwerke oder Empfehlung gefunden haben
- eine unserer unterstützten Sprachen sprechen
- sich damit wohlfühlten, ein webbasiertes KI-Tarot-Tool zu nutzen
- sich selbst in unseren Funnel eingewählt haben
Verallgemeinerungen auf "alle Tarot-Nutzer" sind aus diesem Datensatz nicht gerechtfertigt.
Beobachtend, nicht experimentell. Wir randomisieren nicht, wir haben keine Kontrollgruppe, wir können keine Kausalität herstellen. Wir können Muster beschreiben. Wir können nicht behaupten, sie zu erklären.
Aktualisierungsrhythmus
- Quartalsweise Snapshots: Januar, April, Juli, Oktober. Veröffentlicht als versionierten Datensatz mit Anonymisierungsaudit-Notizen.
- Echtzeit-Aggregatstatistiken: täglich auf dieser Website aktualisiert (Live-Zähler, Top-Karten, Wochentag-Verteilung).
- Pro-Lesungs-Daten: nie in Echtzeit veröffentlicht. Immer in quartalsweise anonymisierte Snapshots gebündelt.
Interessenkonflikt
Der Autor dieser Forschung betreibt aimag.me, das KI-Tarot-Tool, aus dem diese Daten stammen. Das wird auf jeder Seite offengelegt. Wir haben ein finanzielles Interesse daran, dass Nutzer Tarot nützlich genug finden, um bezahlte Tiers zu abonnieren.
Um Verzerrungen durch diesen Konflikt zu minimieren:
- Wir veröffentlichen Daten auch dann, wenn sie für KI-Tarot unvorteilhaft sind (z.B. untergräbt der Major:Minor-Zufallsbefund direkt mystische Behauptungen)
- Wir verpflichten uns, alle quartalsweisen Snapshots zu veröffentlichen, unabhängig davon, was sie zeigen
- Wir dokumentieren und erläutern Methodikänderungen, wenn sie auftreten
- Der Datensatz selbst ist unter Creative-Commons-Lizenz offen — jeder kann seine eigene Analyse durchführen und unseren Interpretationen widersprechen
Lizenz
Auf dieser Website veröffentlichte Statistiken werden unter Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) veröffentlicht.
Zitatformat:
aimag.me Tarot Reading Dataset (n=1.370). Collected 2026-01-01 to 2026-05-02. Anonymized open dataset. Available at aimag.me/research.
Fragen
Für Methodikfragen, Datensatzzugangsanfragen oder Replikationsanfragen: [email protected].
Für RODO/DSGVO-bezogene Auskunftsersuchen beachte unsere Datenschutzrichtlinie.