Questa pagina documenta come raccogliamo, anonimizziamo e analizziamo i dati delle letture di tarocchi AI che pubblichiamo su questo sito. La aggiorniamo ogni volta che la metodologia cambia.

Ultimo aggiornamento: 2026-05-06.

Composizione del campione

Il nostro dataset attuale:

1.370 letture totali
~750 partecipanti unici — composti da:
- 69 utenti registrati (definiti da user_id; deduplicazione rigorosa; 24% delle letture)
- ~680 sessioni ospiti anonime (per impronta IP; 76% delle letture)
7 lingue (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
Finestra temporale: dal 2026-01-01 al 2026-05-02
1.261 letture con testo della domanda (le restanti sono richieste "estrai senza domanda")

Avvertenza importante: le impronte IP degli ospiti sovrastimano i partecipanti unici (più utenti possono condividere un IP — domestico, universitario, NAT aziendale) e sottostimano i visitatori di ritorno (una persona su mobile + casa + lavoro conta come 3). Tratta ~750 come una stima approssimativa dell'ordine di grandezza, non un numero preciso. I 69 registrati sono un dato esatto.

Il dataset cresce continuamente. Gli snapshot trimestrali vengono pubblicati con statistiche complete. Le statistiche in tempo reale possono differire dallo snapshot pubblicato fino a un trimestre.

Cosa raccogliamo

Per ogni lettura, la nostra applicazione registra:

Campo	Tipo	Scopo
ID lettura	UUID	Identificatore unico
Hash user ID	SHA-256	Raggruppamento utenti anonimizzato
Tipo di stesura	enum	Quale stesura (3 carte, Celtic, ecc.)
Carte estratte	array di ID carta	L'ordine conta (posizioni)
Flag rovesciate	array di bool	Per carta
Testo della domanda	testo (opzionale)	Se fornito dall'utente
Categoria della domanda	enum	Categorizzazione automatica: futuro, amore, lavoro, denaro, salute, famiglia, non categorizzata
Lingua	ISO 639-1	Lingua dell'interfaccia al momento della lettura
Timestamp	UTC	Data + ora
Modello AI	enum	gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3
Valutazione utente	1-5 (opzionale)	Feedback post-lettura se fornito

Cosa non registriamo: indirizzo IP (solo hash SHA-256 per la sicurezza), email, nome, posizione fisica oltre al codice paese dalla geolocalizzazione IP, impronte digitali del browser, o qualsiasi altro dato identificativo personale.

Processo di anonimizzazione

Gli ID utente nelle statistiche pubblicate sono hash SHA-256 con un salt per snapshot. Le collisioni di hash sono praticamente zero (spazio di hash 2^256, 69 utenti).

Per le statistiche per carta pubblicate, applichiamo la k-anonimità con k=5:

Le combinazioni di (lingua + tipo_stesura + settimana) con meno di 5 osservazioni vengono aggregate in raggruppamenti di livello superiore prima della pubblicazione
Gli ID di lettura individuali non compaiono mai nei dataset pubblici
Il testo delle domande viene pubblicato solo in conteggi aggregati per categoria, mai verbatim

L'audit completo di anonimizzazione viene eseguito prima di ogni pubblicazione trimestrale. Le note dell'audit sono incluse nel download del dataset.

Attribuzione del provider AI

Le letture vengono generate utilizzando uno dei quattro provider LLM a seconda del tier dell'utente e dello stato della coda:

NVIDIA Llama 3.3 70B — fallback tier gratuito (ultima risorsa)
OpenRouter Gemini 2.5 Flash — tier gratuito primario (≥90% delle letture gratuite)
OpenRouter Qwen3-235B — tier gratuito secondario
OpenRouter GPT-5.4 — letture tier 1 a pagamento ("Seeker")
Anthropic Claude Sonnet 4.6 — letture tier 2 a pagamento ("Mystic"), dual-oracle

L'attribuzione del provider AI per lettura è inclusa nel dataset per i ricercatori che vogliono confrontare il comportamento dei modelli tra provider diversi.

Limiti statistici

Tre limiti sono rilevanti:

Dimensione del campione. 1.370 letture sono sufficienti per rilevare effetti forti (una deviazione del 50%+ dalla casualità, per esempio) ma non sufficienti per test di significatività per singola carta. Per affermare che una carta specifica appare più spesso del caso, avremmo bisogno di circa 6.000 letture secondo il calcolo standard della dimensione del campione chi-quadrato per una distribuzione a 78 categorie. Siamo grossomodo a metà strada.

Bias di selezione. I nostri utenti non sono un campione rappresentativo di tutti gli utenti di tarocchi a livello globale. Sono persone che:

Hanno trovato aimag.me tramite ricerca, social o referral
Parlano una delle nostre lingue supportate
Erano a proprio agio nell'usare uno strumento di tarocchi AI basato sul web
Si sono auto-selezionate nel nostro funnel

La generalizzazione a "tutti gli utenti di tarocchi" non è giustificata da questo dataset.

Osservazionale, non sperimentale. Non randomizziamo, non abbiamo un gruppo di controllo, non possiamo stabilire causalità. Possiamo descrivere pattern. Non possiamo affermare di spiegarli.

Cadenza degli aggiornamenti

Snapshot trimestrali: gennaio, aprile, luglio, ottobre. Pubblicati come dataset versionato con note dell'audit di anonimizzazione.
Statistiche aggregate in tempo reale: aggiornate quotidianamente su questo sito (contatori live, carte più frequenti, distribuzione per giorno della settimana).
Dati per singola lettura: mai pubblicati in tempo reale. Sempre raggruppati in snapshot trimestrali anonimizzati.

Conflitto di interessi

L'autore di questa ricerca gestisce aimag.me, lo strumento di tarocchi AI da cui questi dati vengono raccolti. Questo viene dichiarato su ogni pagina. Abbiamo un interesse finanziario nel fatto che gli utenti trovino i tarocchi abbastanza utili da abbonarsi ai tier a pagamento.

Per minimizzare il bias derivante da questo conflitto:

Pubblichiamo i dati anche quando non sono lusinghieri per i tarocchi AI (ad esempio, il risultato sulla casualità Major:Minor mina direttamente le affermazioni mistiche)
Ci impegniamo a pubblicare tutti gli snapshot trimestrali indipendentemente da ciò che mostrano
Documentiamo e spieghiamo le modifiche metodologiche ogni volta che avvengono
Il dataset stesso è aperto con licenza Creative Commons — chiunque può eseguire la propria analisi e dissentire dalle nostre interpretazioni

Licenza

Le statistiche pubblicate su questo sito sono rilasciate sotto Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).

Formato di citazione:

aimag.me Tarot Reading Dataset (n=1.370). Raccolto dal 2026-01-01 al 2026-05-02. Dataset aperto anonimizzato. Disponibile su aimag.me/research.

Domande

Per domande sulla metodologia, richieste di accesso al dataset o query di replica: [email protected].

Per richieste degli interessati relative al RODO/GDPR, consulta la nostra Informativa sulla Privacy.

Metodologia della Ricerca — Come Raccogliamo e Analizziamo i Dati sui Tarocchi