Esta página documenta cómo recopilamos, anonimizamos y analizamos los datos de lecturas de tarot IA que publicamos en este sitio. La actualizamos cada vez que cambia la metodología.
Última actualización: 2026-05-06.
Composición de la muestra
Nuestro conjunto de datos actual:
- 1.370 lecturas en total
- ~750 participantes únicos — compuestos de:
- 69 usuarios registrados (definidos por user_id; deduplicación estricta; 24% de las lecturas)
- ~680 sesiones de invitados anónimos (por huella IP; 76% de las lecturas)
- 7 idiomas (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
- Ventana temporal: 2026-01-01 a 2026-05-02
- 1.261 lecturas con texto de pregunta (el resto son solicitudes de "extraer sin pregunta")
Aviso importante: las huellas IP de invitados sobreestiman participantes únicos (varios usuarios pueden compartir una IP — hogar, universidad, NAT corporativo) y subestiman usuarios recurrentes (una persona en mobile + casa + trabajo IP cuenta como 3). Trata ~750 como una estimación aproximada, no como un número preciso. El dato de 69 registrados es exacto.
El conjunto de datos crece continuamente. Las instantáneas trimestrales se publican con estadísticas completas. Las estadísticas en tiempo real pueden diferir de la instantánea publicada hasta en un trimestre.
Qué recopilamos
Para cada lectura, nuestra aplicación registra:
| Campo | Tipo | Propósito |
|---|---|---|
| ID de lectura | UUID | Identificador único |
| Hash de ID de usuario | SHA-256 | Agrupación de usuarios anonimizada |
| Tipo de tirada | enum | Qué tirada (3 cartas, Celta, etc.) |
| Cartas extraídas | array de IDs de carta | El orden importa (posiciones) |
| Indicadores de inversión | array de bool | Por carta |
| Texto de pregunta | texto (opcional) | Si el usuario lo proporcionó |
| Categoría de pregunta | enum | Categorizada automáticamente: futuro, amor, trabajo, dinero, salud, familia, sin categorizar |
| Idioma | ISO 639-1 | Idioma de la interfaz en el momento de la lectura |
| Marca de tiempo | UTC | Fecha + hora |
| Modelo de IA | enum | gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3 |
| Valoración del usuario | 1-5 (opcional) | Comentario posterior a la lectura, si se proporcionó |
Lo que no registramos: dirección IP (solo hash SHA-256 por seguridad), correo electrónico, nombre, ubicación física más allá del código de país por geolocalización IP, huellas de navegador, ni ningún otro dato de identificación personal.
Proceso de anonimización
Los ID de usuario en las estadísticas publicadas son hashes SHA-256 con una sal por instantánea. Las colisiones de hash son prácticamente nulas (espacio de hash 2^256, 69 usuarios).
Para las estadísticas por carta publicadas, aplicamos k-anonimidad con k=5:
- Las combinaciones de (idioma + spread_type + semana) con menos de 5 observaciones se agregan a agrupaciones de nivel superior antes de la publicación
- Los ID de lectura individuales nunca aparecen en los conjuntos de datos públicos
- El texto de las preguntas se publica solo en recuentos de categorías agregadas, nunca de forma literal
La auditoría completa de anonimización se realiza antes de cada publicación trimestral. Las notas de auditoría se incluyen en la descarga del conjunto de datos.
Atribución de proveedor de IA
Las lecturas se generan usando uno de cuatro proveedores de LLM según el nivel del usuario y el estado de la cola:
- NVIDIA Llama 3.3 70B — alternativa de nivel gratuito (último recurso)
- OpenRouter Gemini 2.5 Flash — nivel gratuito principal (≥90% de las lecturas gratuitas)
- OpenRouter Qwen3-235B — nivel gratuito secundario
- OpenRouter GPT-5.4 — lecturas de nivel de pago 1 ("Seeker")
- Anthropic Claude Sonnet 4.6 — lecturas de doble oráculo de nivel de pago 2 ("Mystic")
La atribución del proveedor de IA por lectura se incluye en el conjunto de datos para investigadores que deseen comparar el comportamiento de la IA entre proveedores.
Limitaciones estadísticas
Tres limitaciones son relevantes:
Tamaño de la muestra. 1.370 lecturas son suficientes para detectar efectos fuertes (una desviación del 50%+ respecto al azar, por ejemplo), pero no para pruebas de significancia por carta detalladas. Para afirmar que una carta específica aparece con más frecuencia que el azar, necesitaríamos aproximadamente 6.000 lecturas según el cálculo estándar de tamaño de muestra chi-cuadrado para una distribución de 78 categorías. Estamos aproximadamente a la mitad.
Sesgo de selección. Nuestros usuarios no son una muestra representativa de todos los usuarios de tarot a nivel global. Son personas que:
- Encontraron aimag.me a través de búsqueda, redes sociales o referencia
- Hablan uno de nuestros idiomas admitidos
- Estaban cómodos usando una herramienta de tarot IA basada en web
- Se autoseleccionaron en nuestro flujo
La generalización a "todos los usuarios de tarot" no está justificada con este conjunto de datos.
Observacional, no experimental. No aleatorizamos, no tenemos grupo de control, no podemos establecer causalidad. Podemos describir patrones. No podemos afirmar explicarlos.
Frecuencia de actualización
- Instantáneas trimestrales: enero, abril, julio, octubre. Publicadas como un conjunto de datos versionado con notas de auditoría de anonimización.
- Estadísticas agregadas en tiempo real: actualizadas diariamente en este sitio (contadores en vivo, cartas principales, distribución por día de la semana).
- Datos por lectura: nunca publicados en tiempo real. Siempre agrupados en instantáneas trimestrales anonimizadas.
Conflicto de interés
El autor de esta investigación opera aimag.me, la herramienta de tarot IA de la que se recopilan estos datos. Esto se declara en cada página. Tenemos un interés económico en que los usuarios encuentren el tarot lo suficientemente útil como para suscribirse a los niveles de pago.
Para minimizar el sesgo derivado de este conflicto:
- Publicamos datos incluso cuando son desfavorables para el tarot IA (por ejemplo, el hallazgo de aleatoriedad Mayor:Menor socava directamente las afirmaciones místicas)
- Nos comprometemos a publicar todas las instantáneas trimestrales independientemente de lo que muestren
- Documentamos y explicamos los cambios de metodología cada vez que ocurren
- El propio conjunto de datos es abierto bajo licencia Creative Commons — cualquiera puede hacer su propio análisis y estar en desacuerdo con nuestras interpretaciones
Licencia
Las estadísticas publicadas en este sitio se publican bajo Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).
Formato de cita:
aimag.me Tarot Reading Dataset (n=1.370). Recopilado 2026-01-01 a 2026-05-02. Conjunto de datos abierto anonimizado. Disponible en aimag.me/research.
Preguntas
Para preguntas sobre metodología, solicitudes de acceso al conjunto de datos o consultas de replicación: [email protected].
Para solicitudes de interesados relacionadas con RODO/GDPR, consulta nuestra Política de privacidad.