Esta página documenta cómo recopilamos, anonimizamos y analizamos los datos de lecturas de tarot IA que publicamos en este sitio. La actualizamos cada vez que cambia la metodología.

Última actualización: 2026-05-06.

Composición de la muestra

Nuestro conjunto de datos actual:

1.370 lecturas en total
~750 participantes únicos — compuestos de:
- 69 usuarios registrados (definidos por user_id; deduplicación estricta; 24% de las lecturas)
- ~680 sesiones de invitados anónimos (por huella IP; 76% de las lecturas)
7 idiomas (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
Ventana temporal: 2026-01-01 a 2026-05-02
1.261 lecturas con texto de pregunta (el resto son solicitudes de "extraer sin pregunta")

Aviso importante: las huellas IP de invitados sobreestiman participantes únicos (varios usuarios pueden compartir una IP — hogar, universidad, NAT corporativo) y subestiman usuarios recurrentes (una persona en mobile + casa + trabajo IP cuenta como 3). Trata ~750 como una estimación aproximada, no como un número preciso. El dato de 69 registrados es exacto.

El conjunto de datos crece continuamente. Las instantáneas trimestrales se publican con estadísticas completas. Las estadísticas en tiempo real pueden diferir de la instantánea publicada hasta en un trimestre.

Qué recopilamos

Para cada lectura, nuestra aplicación registra:

Campo	Tipo	Propósito
ID de lectura	UUID	Identificador único
Hash de ID de usuario	SHA-256	Agrupación de usuarios anonimizada
Tipo de tirada	enum	Qué tirada (3 cartas, Celta, etc.)
Cartas extraídas	array de IDs de carta	El orden importa (posiciones)
Indicadores de inversión	array de bool	Por carta
Texto de pregunta	texto (opcional)	Si el usuario lo proporcionó
Categoría de pregunta	enum	Categorizada automáticamente: futuro, amor, trabajo, dinero, salud, familia, sin categorizar
Idioma	ISO 639-1	Idioma de la interfaz en el momento de la lectura
Marca de tiempo	UTC	Fecha + hora
Modelo de IA	enum	gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3
Valoración del usuario	1-5 (opcional)	Comentario posterior a la lectura, si se proporcionó

Lo que no registramos: dirección IP (solo hash SHA-256 por seguridad), correo electrónico, nombre, ubicación física más allá del código de país por geolocalización IP, huellas de navegador, ni ningún otro dato de identificación personal.

Proceso de anonimización

Los ID de usuario en las estadísticas publicadas son hashes SHA-256 con una sal por instantánea. Las colisiones de hash son prácticamente nulas (espacio de hash 2^256, 69 usuarios).

Para las estadísticas por carta publicadas, aplicamos k-anonimidad con k=5:

Las combinaciones de (idioma + spread_type + semana) con menos de 5 observaciones se agregan a agrupaciones de nivel superior antes de la publicación
Los ID de lectura individuales nunca aparecen en los conjuntos de datos públicos
El texto de las preguntas se publica solo en recuentos de categorías agregadas, nunca de forma literal

La auditoría completa de anonimización se realiza antes de cada publicación trimestral. Las notas de auditoría se incluyen en la descarga del conjunto de datos.

Atribución de proveedor de IA

Las lecturas se generan usando uno de cuatro proveedores de LLM según el nivel del usuario y el estado de la cola:

NVIDIA Llama 3.3 70B — alternativa de nivel gratuito (último recurso)
OpenRouter Gemini 2.5 Flash — nivel gratuito principal (≥90% de las lecturas gratuitas)
OpenRouter Qwen3-235B — nivel gratuito secundario
OpenRouter GPT-5.4 — lecturas de nivel de pago 1 ("Seeker")
Anthropic Claude Sonnet 4.6 — lecturas de doble oráculo de nivel de pago 2 ("Mystic")

La atribución del proveedor de IA por lectura se incluye en el conjunto de datos para investigadores que deseen comparar el comportamiento de la IA entre proveedores.

Limitaciones estadísticas

Tres limitaciones son relevantes:

Tamaño de la muestra. 1.370 lecturas son suficientes para detectar efectos fuertes (una desviación del 50%+ respecto al azar, por ejemplo), pero no para pruebas de significancia por carta detalladas. Para afirmar que una carta específica aparece con más frecuencia que el azar, necesitaríamos aproximadamente 6.000 lecturas según el cálculo estándar de tamaño de muestra chi-cuadrado para una distribución de 78 categorías. Estamos aproximadamente a la mitad.

Sesgo de selección. Nuestros usuarios no son una muestra representativa de todos los usuarios de tarot a nivel global. Son personas que:

Encontraron aimag.me a través de búsqueda, redes sociales o referencia
Hablan uno de nuestros idiomas admitidos
Estaban cómodos usando una herramienta de tarot IA basada en web
Se autoseleccionaron en nuestro flujo

La generalización a "todos los usuarios de tarot" no está justificada con este conjunto de datos.

Observacional, no experimental. No aleatorizamos, no tenemos grupo de control, no podemos establecer causalidad. Podemos describir patrones. No podemos afirmar explicarlos.

Frecuencia de actualización

Instantáneas trimestrales: enero, abril, julio, octubre. Publicadas como un conjunto de datos versionado con notas de auditoría de anonimización.
Estadísticas agregadas en tiempo real: actualizadas diariamente en este sitio (contadores en vivo, cartas principales, distribución por día de la semana).
Datos por lectura: nunca publicados en tiempo real. Siempre agrupados en instantáneas trimestrales anonimizadas.

Conflicto de interés

El autor de esta investigación opera aimag.me, la herramienta de tarot IA de la que se recopilan estos datos. Esto se declara en cada página. Tenemos un interés económico en que los usuarios encuentren el tarot lo suficientemente útil como para suscribirse a los niveles de pago.

Para minimizar el sesgo derivado de este conflicto:

Publicamos datos incluso cuando son desfavorables para el tarot IA (por ejemplo, el hallazgo de aleatoriedad Mayor:Menor socava directamente las afirmaciones místicas)
Nos comprometemos a publicar todas las instantáneas trimestrales independientemente de lo que muestren
Documentamos y explicamos los cambios de metodología cada vez que ocurren
El propio conjunto de datos es abierto bajo licencia Creative Commons — cualquiera puede hacer su propio análisis y estar en desacuerdo con nuestras interpretaciones

Licencia

Las estadísticas publicadas en este sitio se publican bajo Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).

Formato de cita:

aimag.me Tarot Reading Dataset (n=1.370). Recopilado 2026-01-01 a 2026-05-02. Conjunto de datos abierto anonimizado. Disponible en aimag.me/research.

Preguntas

Para preguntas sobre metodología, solicitudes de acceso al conjunto de datos o consultas de replicación: [email protected].

Para solicitudes de interesados relacionadas con RODO/GDPR, consulta nuestra Política de privacidad.

Metodología de investigación — Cómo recopilamos y analizamos datos de tarot