Esta página documenta como coletamos, anonimizamos e analisamos os dados de leituras de tarô IA que publicamos neste site. Atualizamos sempre que a metodologia muda.
Última atualização: 2026-05-06.
Composição da amostra
Nosso conjunto de dados atual:
- 1.370 leituras no total
- ~750 participantes únicos — compostos por:
- 69 usuários registrados (definidos por user_id; deduplicação estrita; 24% das leituras)
- ~680 sessões de visitantes anônimos (por fingerprint de IP; 76% das leituras)
- 7 idiomas (EN 90,7%, PL 3,6%, PT 2,9%, FR 1,2%, ES 0,9%, DE 0,4%, IT 0,2%)
- Janela de tempo: 2026-01-01 a 2026-05-02
- 1.261 leituras com texto de pergunta (o restante são solicitações de "sorteio sem pergunta")
Ressalva importante: fingerprints de IP de visitantes supercontam participantes únicos (vários usuários podem compartilhar um IP — doméstico, universitário, NAT corporativo) e subcontam usuários que retornam (uma pessoa no celular + em casa + no trabalho conta como 3). Trate ~750 como uma estimativa de ordem de grandeza aproximada, não um número preciso. Os 69 registrados são exatos.
O conjunto de dados cresce continuamente. Snapshots trimestrais são publicados com estatísticas completas. As estatísticas em tempo real podem diferir do snapshot publicado em até um trimestre.
O que coletamos
Para cada leitura, nossa aplicação registra:
| Campo | Tipo | Finalidade |
|---|---|---|
| ID da leitura | UUID | Identificador único |
| Hash do ID do usuário | SHA-256 | Agrupamento de usuário anonimizado |
| Tipo de spread | enum | Qual spread (3 cartas, Celta, etc.) |
| Cartas sorteadas | array de IDs de cartas | A ordem importa (posições) |
| Flags de reversão | array de bool | Por carta |
| Texto da pergunta | texto (opcional) | Se o usuário forneceu |
| Categoria da pergunta | enum | Categorizado automaticamente: futuro, amor, trabalho, dinheiro, saúde, família, sem categoria |
| Idioma | ISO 639-1 | Idioma da interface no momento da leitura |
| Timestamp | UTC | Data + hora |
| Modelo de IA | enum | gpt-5.4 / claude-sonnet-4.6 / gemini-2.5-flash / nvidia-llama-3.3 |
| Avaliação do usuário | 1-5 (opcional) | Feedback pós-leitura, se fornecido |
O que não registramos: endereço IP (apenas hash SHA-256 por segurança), e-mail, nome, localização física além do código de país por geolocalização de IP, fingerprints de navegador, ou qualquer outro dado de identificação pessoal.
Processo de anonimização
Os IDs de usuário nas estatísticas publicadas são hashes SHA-256 com um salt por snapshot. Colisões de hash são praticamente zero (espaço de hash de 2^256, 69 usuários).
Para estatísticas publicadas por carta, aplicamos k-anonimato com k=5:
- Combinações de (idioma + tipo_de_spread + semana) com menos de 5 observações são agregadas a agrupamentos de nível superior antes da publicação
- IDs individuais de leitura nunca aparecem em conjuntos de dados públicos
- O texto das perguntas é publicado apenas em contagens de categorias agregadas, nunca na íntegra
A auditoria completa de anonimização é realizada antes de cada publicação trimestral. As notas da auditoria são incluídas no download do conjunto de dados.
Atribuição por provedor de IA
As leituras são geradas usando um dos quatro provedores de LLM, dependendo do plano do usuário e do status da fila:
- NVIDIA Llama 3.3 70B — último recurso para plano gratuito
- OpenRouter Gemini 2.5 Flash — plano gratuito principal (≥90% das leituras gratuitas)
- OpenRouter Qwen3-235B — plano gratuito secundário
- OpenRouter GPT-5.4 — leituras do Nível 1 pago ("Seeker")
- Anthropic Claude Sonnet 4.6 — leituras duplas do Nível 2 pago ("Mystic")
A atribuição do provedor de IA por leitura está incluída no conjunto de dados para pesquisadores que queiram comparar o comportamento de IA entre provedores.
Limitações estatísticas
Três limitações são relevantes:
Tamanho da amostra. 1.370 leituras são suficientes para detectar efeitos fortes (um desvio de 50%+ em relação ao aleatório, por exemplo), mas não para testes de significância por carta em granularidade fina. Para afirmar que uma carta específica aparece mais do que o acaso preveria, precisaríamos de aproximadamente 6.000 leituras, conforme o cálculo padrão de tamanho de amostra qui-quadrado para uma distribuição de 78 categorias. Estamos aproximadamente na metade do caminho.
Viés de seleção. Nossos usuários não são uma amostra representativa de todos os usuários de tarô globalmente. São pessoas que:
- Encontraram o aimag.me via busca, redes sociais ou indicação
- Falam um dos nossos idiomas suportados
- Ficaram à vontade usando uma ferramenta de tarô IA baseada na web
- Se autosselecionaram no nosso funil
Generalização para "todos os usuários de tarô" não é justificada a partir deste conjunto de dados.
Observacional, não experimental. Não randomizamos, não temos grupo de controle, não podemos estabelecer causalidade. Podemos descrever padrões. Não podemos afirmar explicá-los.
Cadência de atualização
- Snapshots trimestrais: janeiro, abril, julho, outubro. Publicados como conjunto de dados versionado com notas de auditoria de anonimização.
- Estatísticas agregadas em tempo real: atualizadas diariamente neste site (contadores ao vivo, cartas mais sorteadas, distribuição por dia da semana).
- Dados por leitura: nunca publicados em tempo real. Sempre agrupados em snapshots trimestrais anonimizados.
Conflito de interesse
O autor desta pesquisa opera o aimag.me, a ferramenta de tarô IA de onde estes dados são coletados. Isso é declarado em todas as páginas. Temos interesse financeiro em que os usuários considerem o tarô útil o suficiente para assinar planos pagos.
Para minimizar o viés decorrente desse conflito:
- Publicamos dados mesmo quando são desfavoráveis ao tarô IA (por exemplo, a descoberta de aleatoriedade na proporção Maior:Menor contradiz diretamente as afirmações místicas)
- Comprometemo-nos a publicar todos os snapshots trimestrais independentemente do que mostrem
- Documentamos e explicamos as mudanças de metodologia sempre que ocorrem
- O próprio conjunto de dados é aberto sob licença Creative Commons — qualquer pessoa pode fazer sua própria análise e discordar das nossas interpretações
Licença
As estatísticas publicadas neste site são disponibilizadas sob Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).
Formato de citação:
aimag.me Tarot Reading Dataset (n=1.370). Coletado de 2026-01-01 a 2026-05-02. Conjunto de dados aberto e anonimizado. Disponível em aimag.me/research.
Perguntas
Para dúvidas sobre metodologia, solicitações de acesso ao conjunto de dados ou consultas de replicação: [email protected].
Para solicitações de titulares de dados relacionadas a RODO/GDPR, consulte nossa Política de Privacidade.