Zum Inhalt springen
Forschung Methodik Transparenz rodo

Forschungsmethodik — Wie wir Tarot-Daten erheben und analysieren

Transparente Dokumentation unseres Datenerfassungsprozesses, der Anonymisierung, der KI-Anbieterzuordnung, der Stichprobengrenzen und des Aktualisierungsrhythmus. n=1.370 Lesungen, 69 Nutzer, 7 Sprachen.

Tomasz Fiedoruk 6 min read n=1370

Diese Seite dokumentiert, wie wir die KI-Tarot-Lesungsdaten, die wir auf dieser Website veröffentlichen, erheben, anonymisieren und analysieren. Wir aktualisieren sie, wenn sich die Methodik ändert.

Zuletzt aktualisiert: 2026-05-06.

Zusammensetzung der Stichprobe

Unser aktueller Datensatz:

  • 1.370 Lesungen insgesamt
  • ~750 einzigartige Teilnehmer — zusammengesetzt aus:
    • 69 registrierte Nutzer (definiert durch user_id; strenge Deduplizierung; 24% der Lesungen)
    • ~680 anonyme Gastsitzungen (per IP-Fingerabdruck; 76% der Lesungen)
  • 7 Sprachen (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
  • Zeitfenster: 2026-01-01 bis 2026-05-02
  • 1.261 Lesungen mit Fragetext (der Rest sind "Ziehen ohne Frage"-Anfragen)

Wichtiger Vorbehalt: Gast-IP-Fingerabdrücke überzählen einzigartige Teilnehmer (mehrere Nutzer können eine IP teilen — Haushalt, Universität, Corporate-NAT) und unterschätzen wiederkehrende Nutzer (eine Person über mobile + Heim + Arbeits-IPs zählt als 3). ~750 ist eine grobe Größenordnung, keine genaue Zahl. Die 69 registrierten Nutzer sind exakt.

Der Datensatz wächst kontinuierlich. Quartalsweise Snapshots werden mit vollständigen Statistiken veröffentlicht. Echtzeit-Statistiken können vom veröffentlichten Snapshot um bis zu ein Quartal abweichen.

Was wir erfassen

Für jede Lesung protokolliert unsere Anwendung:

Feld Typ Zweck
Lesungs-ID UUID Eindeutige Kennung
Nutzer-ID-Hash SHA-256 Anonymisierte Nutzergruppierung
Spread-Typ enum Welcher Spread (3-Karten, Celtic, etc.)
Gezogene Karten Array von Karten-IDs Reihenfolge relevant (Positionen)
Umkehr-Flags Array von bool Pro Karte
Fragetext Text (optional) Falls vom Nutzer angegeben
Fragekategorie enum Automatisch kategorisiert: Zukunft, Liebe, Arbeit, Geld, Gesundheit, Familie, unkategorisiert
Sprache ISO 639-1 UI-Sprache zum Zeitpunkt der Lesung
Zeitstempel UTC Datum + Uhrzeit
KI-Modell enum gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3
Nutzerbewertung 1-5 (optional) Feedback nach der Lesung, falls gegeben

Was wir nicht protokollieren: IP-Adresse (nur SHA-256-Hash zur Sicherheit), E-Mail, Name, physischen Standort über den Ländercode aus der IP-Geolokalisierung hinaus, Browser-Fingerabdrücke oder andere personenidentifizierende Daten.

Anonymisierungsprozess

Nutzer-IDs in veröffentlichten Statistiken sind SHA-256-Hashes mit einem Snapshot-spezifischen Salt. Hash-Kollisionen sind praktisch null (2^256 Hash-Raum, 69 Nutzer).

Für veröffentlichte Pro-Karten-Statistiken wenden wir k-Anonymität mit k=5 an:

  • Kombinationen aus (Sprache + Spread-Typ + Woche) mit weniger als 5 Beobachtungen werden vor der Veröffentlichung in übergeordnete Gruppierungen aggregiert
  • Einzelne Lesungs-IDs erscheinen nie in öffentlichen Datensätzen
  • Fragetext wird nur in aggregierten Kategoriezählungen veröffentlicht, nie im Wortlaut

Der vollständige Anonymisierungsaudit wird vor jeder quartalsweisen Veröffentlichung durchgeführt. Audit-Notizen sind im Datensatz-Download enthalten.

KI-Anbieterzuordnung

Lesungen werden mit einem von vier LLM-Anbietern generiert, abhängig von Nutzer-Tier und Warteschlangenstatus:

  • NVIDIA Llama 3.3 70B — Fallback für das kostenlose Tier (letzter Ausweg)
  • OpenRouter Gemini 2.5 Flash — primäres kostenloses Tier (≥90% der kostenlosen Lesungen)
  • OpenRouter Qwen3-235B — sekundäres kostenloses Tier
  • OpenRouter GPT-5.4 — bezahltes Tier 1 ("Seeker")-Lesungen
  • Anthropic Claude Sonnet 4.6 — bezahltes Tier 2 ("Mystic") Dual-Oracle-Lesungen

Die Pro-Lesung-KI-Anbieterzuordnung ist im Datensatz enthalten, damit Forscher das KI-Verhalten über Anbieter hinweg vergleichen können.

Statistische Grenzen

Drei Grenzen sind relevant:

Stichprobengröße. 1.370 Lesungen reichen aus, um starke Effekte zu erkennen (z.B. eine Abweichung von 50%+ vom Zufall), aber nicht für detaillierte Pro-Karten-Signifikanztests. Um zu behaupten, dass eine bestimmte Karte öfter erscheint als der Zufall erwarten würde, bräuchten wir nach der Standard-Chi-Quadrat-Stichprobengrößenberechnung für eine 78-Kategorien-Verteilung ungefähr 6.000 Lesungen. Wir sind etwa auf halbem Weg.

Auswahlverzerrung. Unsere Nutzer sind keine repräsentative Stichprobe aller Tarot-Nutzer weltweit. Sie sind Menschen, die:

  • aimag.me durch Suche, soziale Netzwerke oder Empfehlung gefunden haben
  • eine unserer unterstützten Sprachen sprechen
  • sich damit wohlfühlten, ein webbasiertes KI-Tarot-Tool zu nutzen
  • sich selbst in unseren Funnel eingewählt haben

Verallgemeinerungen auf "alle Tarot-Nutzer" sind aus diesem Datensatz nicht gerechtfertigt.

Beobachtend, nicht experimentell. Wir randomisieren nicht, wir haben keine Kontrollgruppe, wir können keine Kausalität herstellen. Wir können Muster beschreiben. Wir können nicht behaupten, sie zu erklären.

Aktualisierungsrhythmus

  • Quartalsweise Snapshots: Januar, April, Juli, Oktober. Veröffentlicht als versionierten Datensatz mit Anonymisierungsaudit-Notizen.
  • Echtzeit-Aggregatstatistiken: täglich auf dieser Website aktualisiert (Live-Zähler, Top-Karten, Wochentag-Verteilung).
  • Pro-Lesungs-Daten: nie in Echtzeit veröffentlicht. Immer in quartalsweise anonymisierte Snapshots gebündelt.

Interessenkonflikt

Der Autor dieser Forschung betreibt aimag.me, das KI-Tarot-Tool, aus dem diese Daten stammen. Das wird auf jeder Seite offengelegt. Wir haben ein finanzielles Interesse daran, dass Nutzer Tarot nützlich genug finden, um bezahlte Tiers zu abonnieren.

Um Verzerrungen durch diesen Konflikt zu minimieren:

  • Wir veröffentlichen Daten auch dann, wenn sie für KI-Tarot unvorteilhaft sind (z.B. untergräbt der Major:Minor-Zufallsbefund direkt mystische Behauptungen)
  • Wir verpflichten uns, alle quartalsweisen Snapshots zu veröffentlichen, unabhängig davon, was sie zeigen
  • Wir dokumentieren und erläutern Methodikänderungen, wenn sie auftreten
  • Der Datensatz selbst ist unter Creative-Commons-Lizenz offen — jeder kann seine eigene Analyse durchführen und unseren Interpretationen widersprechen

Lizenz

Auf dieser Website veröffentlichte Statistiken werden unter Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) veröffentlicht.

Zitatformat:

aimag.me Tarot Reading Dataset (n=1.370). Collected 2026-01-01 to 2026-05-02. Anonymized open dataset. Available at aimag.me/research.

Fragen

Für Methodikfragen, Datensatzzugangsanfragen oder Replikationsanfragen: [email protected].

Für RODO/DSGVO-bezogene Auskunftsersuchen beachte unsere Datenschutzrichtlinie.

Cite this research

If you use this in research, journalism, or analysis:

Fiedoruk, T. (2026). Forschungsmethodik — Wie wir Tarot-Daten erheben und analysieren. aimag.me Research. Retrieved from https://aimag.me/research/methodology

License: CC BY-SA 4.0. Dataset: /research/dataset

Want to add your own reading to the next snapshot?

Try a free reading on aimag.me →
Startseite Karten Legung Anmelden