Ir al contenido
investigación metodología transparencia rodo

Metodología de investigación — Cómo recopilamos y analizamos datos de tarot

Documentación transparente de nuestro proceso de recopilación de datos, anonimización, atribución de proveedor de IA, limitaciones de la muestra y frecuencia de actualización. n=1.370 lecturas, 69 usuarios, 7 idiomas.

Tomasz Fiedoruk 6 min read n=1370

Esta página documenta cómo recopilamos, anonimizamos y analizamos los datos de lecturas de tarot IA que publicamos en este sitio. La actualizamos cada vez que cambia la metodología.

Última actualización: 2026-05-06.

Composición de la muestra

Nuestro conjunto de datos actual:

  • 1.370 lecturas en total
  • ~750 participantes únicos — compuestos de:
    • 69 usuarios registrados (definidos por user_id; deduplicación estricta; 24% de las lecturas)
    • ~680 sesiones de invitados anónimos (por huella IP; 76% de las lecturas)
  • 7 idiomas (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
  • Ventana temporal: 2026-01-01 a 2026-05-02
  • 1.261 lecturas con texto de pregunta (el resto son solicitudes de "extraer sin pregunta")

Aviso importante: las huellas IP de invitados sobreestiman participantes únicos (varios usuarios pueden compartir una IP — hogar, universidad, NAT corporativo) y subestiman usuarios recurrentes (una persona en mobile + casa + trabajo IP cuenta como 3). Trata ~750 como una estimación aproximada, no como un número preciso. El dato de 69 registrados es exacto.

El conjunto de datos crece continuamente. Las instantáneas trimestrales se publican con estadísticas completas. Las estadísticas en tiempo real pueden diferir de la instantánea publicada hasta en un trimestre.

Qué recopilamos

Para cada lectura, nuestra aplicación registra:

Campo Tipo Propósito
ID de lectura UUID Identificador único
Hash de ID de usuario SHA-256 Agrupación de usuarios anonimizada
Tipo de tirada enum Qué tirada (3 cartas, Celta, etc.)
Cartas extraídas array de IDs de carta El orden importa (posiciones)
Indicadores de inversión array de bool Por carta
Texto de pregunta texto (opcional) Si el usuario lo proporcionó
Categoría de pregunta enum Categorizada automáticamente: futuro, amor, trabajo, dinero, salud, familia, sin categorizar
Idioma ISO 639-1 Idioma de la interfaz en el momento de la lectura
Marca de tiempo UTC Fecha + hora
Modelo de IA enum gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3
Valoración del usuario 1-5 (opcional) Comentario posterior a la lectura, si se proporcionó

Lo que no registramos: dirección IP (solo hash SHA-256 por seguridad), correo electrónico, nombre, ubicación física más allá del código de país por geolocalización IP, huellas de navegador, ni ningún otro dato de identificación personal.

Proceso de anonimización

Los ID de usuario en las estadísticas publicadas son hashes SHA-256 con una sal por instantánea. Las colisiones de hash son prácticamente nulas (espacio de hash 2^256, 69 usuarios).

Para las estadísticas por carta publicadas, aplicamos k-anonimidad con k=5:

  • Las combinaciones de (idioma + spread_type + semana) con menos de 5 observaciones se agregan a agrupaciones de nivel superior antes de la publicación
  • Los ID de lectura individuales nunca aparecen en los conjuntos de datos públicos
  • El texto de las preguntas se publica solo en recuentos de categorías agregadas, nunca de forma literal

La auditoría completa de anonimización se realiza antes de cada publicación trimestral. Las notas de auditoría se incluyen en la descarga del conjunto de datos.

Atribución de proveedor de IA

Las lecturas se generan usando uno de cuatro proveedores de LLM según el nivel del usuario y el estado de la cola:

  • NVIDIA Llama 3.3 70B — alternativa de nivel gratuito (último recurso)
  • OpenRouter Gemini 2.5 Flash — nivel gratuito principal (≥90% de las lecturas gratuitas)
  • OpenRouter Qwen3-235B — nivel gratuito secundario
  • OpenRouter GPT-5.4 — lecturas de nivel de pago 1 ("Seeker")
  • Anthropic Claude Sonnet 4.6 — lecturas de doble oráculo de nivel de pago 2 ("Mystic")

La atribución del proveedor de IA por lectura se incluye en el conjunto de datos para investigadores que deseen comparar el comportamiento de la IA entre proveedores.

Limitaciones estadísticas

Tres limitaciones son relevantes:

Tamaño de la muestra. 1.370 lecturas son suficientes para detectar efectos fuertes (una desviación del 50%+ respecto al azar, por ejemplo), pero no para pruebas de significancia por carta detalladas. Para afirmar que una carta específica aparece con más frecuencia que el azar, necesitaríamos aproximadamente 6.000 lecturas según el cálculo estándar de tamaño de muestra chi-cuadrado para una distribución de 78 categorías. Estamos aproximadamente a la mitad.

Sesgo de selección. Nuestros usuarios no son una muestra representativa de todos los usuarios de tarot a nivel global. Son personas que:

  • Encontraron aimag.me a través de búsqueda, redes sociales o referencia
  • Hablan uno de nuestros idiomas admitidos
  • Estaban cómodos usando una herramienta de tarot IA basada en web
  • Se autoseleccionaron en nuestro flujo

La generalización a "todos los usuarios de tarot" no está justificada con este conjunto de datos.

Observacional, no experimental. No aleatorizamos, no tenemos grupo de control, no podemos establecer causalidad. Podemos describir patrones. No podemos afirmar explicarlos.

Frecuencia de actualización

  • Instantáneas trimestrales: enero, abril, julio, octubre. Publicadas como un conjunto de datos versionado con notas de auditoría de anonimización.
  • Estadísticas agregadas en tiempo real: actualizadas diariamente en este sitio (contadores en vivo, cartas principales, distribución por día de la semana).
  • Datos por lectura: nunca publicados en tiempo real. Siempre agrupados en instantáneas trimestrales anonimizadas.

Conflicto de interés

El autor de esta investigación opera aimag.me, la herramienta de tarot IA de la que se recopilan estos datos. Esto se declara en cada página. Tenemos un interés económico en que los usuarios encuentren el tarot lo suficientemente útil como para suscribirse a los niveles de pago.

Para minimizar el sesgo derivado de este conflicto:

  • Publicamos datos incluso cuando son desfavorables para el tarot IA (por ejemplo, el hallazgo de aleatoriedad Mayor:Menor socava directamente las afirmaciones místicas)
  • Nos comprometemos a publicar todas las instantáneas trimestrales independientemente de lo que muestren
  • Documentamos y explicamos los cambios de metodología cada vez que ocurren
  • El propio conjunto de datos es abierto bajo licencia Creative Commons — cualquiera puede hacer su propio análisis y estar en desacuerdo con nuestras interpretaciones

Licencia

Las estadísticas publicadas en este sitio se publican bajo Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0).

Formato de cita:

aimag.me Tarot Reading Dataset (n=1.370). Recopilado 2026-01-01 a 2026-05-02. Conjunto de datos abierto anonimizado. Disponible en aimag.me/research.

Preguntas

Para preguntas sobre metodología, solicitudes de acceso al conjunto de datos o consultas de replicación: [email protected].

Para solicitudes de interesados relacionadas con RODO/GDPR, consulta nuestra Política de privacidad.

Cite this research

If you use this in research, journalism, or analysis:

Fiedoruk, T. (2026). Metodología de investigación — Cómo recopilamos y analizamos datos de tarot. aimag.me Research. Retrieved from https://aimag.me/research/methodology

License: CC BY-SA 4.0. Dataset: /research/dataset

Want to add your own reading to the next snapshot?

Try a free reading on aimag.me →
Inicio Cartas Lectura Iniciar sesión