Portada Directorio Buscador Álbum Redacción Correo
La insignia
8 de janeiro de 2003


Sorteio ou pseudo-sorteio?


Felipe A. P. L. Costa (*)
La Insignia. Brasil, janeiro de 2003.


Em novembro de 2002, participei de um 'sorteio' em uma universidade federal brasileira. O prêmio em questão era uma das 80 vagas que estavam sendo oferecidas para ingresso de crianças na primeira série do Primeiro Grau, no ano letivo de 2003, no colégio de aplicação da mesma universidade. O colégio tem muito boa fama e, por isso mesmo, o número de inscritos (754) não foi nenhum exagero, embora nem todos os pais ou responsáveis pelas crianças tenham comparecido ao encontro. [1]

Até onde pude perceber, tudo transcorreu bem e nada me permitiria levantar dúvidas sobre a boa-fé do pessoal envolvido na organização e na condução dos trabalhos. Todavia, como tento mostrar a seguir, não é preciso haver má-fé para que um sorteio se transforme em um pseudo-sorteio. Quer dizer, os resultados tendenciosos obtidos -- o que, no âmbito desse artigo, caracteriza um pseudo-sorteio -- foram produzidos por processos cujos inconvenientes, ao que parece, não eram de conhecimento do pessoal envolvido. Em princípio, portanto, diria simplesmente que o referido encontro transcorreu em uma atmosfera de ingenuidade estatística.


Probabilidade

Expressões como 'chance', 'probabilidade', 'erro', 'sorteio' e 'incerteza' fazem parte do vocabulário diário daqueles que lidam com um ramo da matemática chamado probabilidade. Alguns dos seus pioneiros -- como Blaise Pascal (1623-1662) e Pierre de Fermat (1601-1665) -- estavam interessados justamente em predizer os prováveis resultados de certos jogos de azar (com cartas e dados, por exemplo) praticados pelos nobres franceses daquela época. [2]

A probabilidade de um evento incerto é uma medida numérica que nos diz quão provável é que o evento venha a ocorrer. Uma baixa probabilidade significa que são reduzidas as chances de que determinado evento ocorra. Podemos dizer que a probabilidade de um evento é uma função de sua freqüência: a chance de retirar uma bola verde de uma caixa contendo apenas bolas amarelas é zero; mas esse valor cresce à medida que o número de bolas verdes aumenta. Em outras palavras: a probabilidade de um evento é igual à freqüência observada desse evento dividido pelo número total de eventos possíveis. Por exemplo, a probabilidade de retirar uma bola verde de uma caixa contendo 200 bolas, das quais 40 são verdes, é igual a 40 / 200 = 0,2 -- isto é, 20 por cento, o que corresponde a uma chance de sucesso a cada cinco tentativas.

Eventos aleatórios podem ser descritos por equações matemáticas na forma de funções probabilísticas: quer dizer, nós não sabemos exatamente qual resultado prevalecerá, mas podemos estimar as chances das diversas alternativas possíveis. Dizemos que uma amostragem é aleatória quando a amostra produzida é uma representação fiel da distribuição de eventos tal qual eles ocorrem na natureza. [3] O grau de fidedignidade de uma amostragem geralmente está -- ou deveria estar -- sob controle do experimentador e depende dos procedimentos adotados. Sorteio é um tipo de amostragem. No âmbito deste artigo, em um sorteio -- seja jogando uma moeda para o alto, por exemplo, seja retirando bolas de dentro de uma caixa -- as chances de todos os diferentes tipos de resultado são iguais entre si e permanecem rigorosamente inalteradas, do início ao fim do processo. Se uma ou outra dessas condições não são satisfeitas, deixamos de ter um sorteio e passamos a ter então um pseudo-sorteio.

A boa notícia é que, dentro de determinados limites de segurança e precisão, nós podemos detectar, quantificar e qualificar esses desvios -- quer dizer, podemos detectar se um sorteio ultrapassou a linha a partir da qual ele passa a se comportar como um pseudo-sorteio. Para muitas dessas situações, existem testes estatísticos padronizados, que comparam a magnitude dos desvios entre os resultados esperados e os obtidos. Quando os valores obtidos não diferem tanto assim dos esperados, não temos como recusar a hipótese de que os dois conjuntos são amostras que representam uma mesma realidade. No caso em questão (Tabela 1), entretanto, as discrepâncias foram de tal ordem que podemos tratar os resultados obtidos como frutos de um pseudo-sorteio. Ao afirmar isso, de acordo com o teste estatístico que apliquei, minha margem de segurança é de 95% -- há, portanto, uma chance de 5% de que eu simplesmente esteja afirmando uma bobagem. Em outras palavras, resultados tão discrepantes quanto os que presenciei naquela manhã de novembro de 2002 são esperados, como meros frutos do acaso, uma a cada 20 vezes. [4]

Classificar o que houve como um pseudo-sorteio significa, entre outras coisas, que as chances dos diferentes tipos de resultado não permaneceram iguais entre si, durante todo o processo. Alguns grupos de números (digamos, os intervalos 101-200 e 501-600), por exemplo, tinham chances muito maiores de serem sorteados do que outros (como os intervalos 401-500 e 1-100); muito embora, a priori, nenhum de nós fosse capaz de dizer exatamente quais dos oito grupos seriam beneficiados e quais seriam prejudicados. [5] Na verdade, foi justamente por causa desse aparente desconhecimento a priori que eu afirmei, no início deste artigo, que não é preciso haver má-fé para que haja um pseudo-sorteio.


Especulando sobre a física de um pseudo-sorteio

De um ponto de vista estatístico, o evento do qual participei em novembro 2002 foi tendencioso, não merecendo, portanto, ser chamado de sorteio. Essa conclusão está fundamentada nos resultados obtidos com a aplicação de um tipo particular de teste estatístico, empregado em casos como esse justamente para checar o grau de disparidade entre valores esperados e os observados. Nesse ponto, é importante frisar que temos aqui dois níveis de discussão: o nível meramente estatístico, que olha diretamente para os resultados obtidos, e o nível físico (mecânico), que quer saber exatamente como aqueles resultados foram gerados -- isto é, se nenhum procedimento irregular foi deliberadamente implantado em uma determinada 'máquina de sorteio', por que os resultados gerados por ela são tão tendenciosos?

Uma resposta satisfatória para esta última pergunta está além dos propósitos deste artigo, mas tenho um palpite: a urna de madeira utilizada (mais ou menos cilíndrica, dentro da qual dificilmente caberia qualquer das crianças sorteadas) era pequena demais para permitir uma movimentação aleatória de tantas peças no seu interior. [6] Na verdade, para que isso fosse possível, imagino que a urna teria que ser quase tão grande quanto o ginásio de esportes dentro do qual todos nós estávamos. Em todo o caso, o ponto fundamental aqui é: mesmo sem poder oferecer uma explicação física satisfatória, podemos dizer, dentro de certos limites, se os resultados gerados por uma máquina de sorteio são ou não tendenciosos; o que, em caso afirmativo, permite levantar suspeitas sobre os procedimentos adotados ou sobre o bom funcionamento do próprio equipamento.

Em termos práticos, sou de opinião que (a) chacoalhar uma massa de pedrinhas dentro de um recipiente de tamanho tão limitado é um procedimento inadequado e, como tal, jamais deveria ser adotado como 'máquina de sorteio' (não só na universidade em questão, claro, mas em qualquer lugar do Universo onde as leis ordinárias da física se apliquem); e (b) a administração da referida universidade (que já foi alertada para o problema) deveria de alguma maneira tentar remediar os efeitos da barbeiragem que cometeu -- só não deve esconder o problema ou fazer de conta que está tudo certo, pois não está...


Notas

(*) Biólogo.

1. O procedimento adotado pelos organizadores foi de um sorteio sem reposição: as peças com os números sorteados eram retiradas antes que uma nova rodada fosse realizada. Entretanto, se o responsável pela criança não estivesse presente no momento em que o seu número era anunciado, a peça voltava para a urna. E isso ocorreu quatro vezes, sendo que um mesmo número chegou a ser anunciado e retornou para a urna em duas ocasiões!
2. Ver, por exemplo, Murteira, B. J. F. 1979. Probabilidades e estatística, 2 volumes. Lisboa, Mc-Graw-Hill.
3. Em termos mais formais: uma amostra aleatória de tamanho N, de uma variável aleatória X, corresponde a N mensurações repetidas de X, feitas sob condições essencialmente inalteradas. Na maioria dos casos, porém, essa noção matemática é apenas aproximada pelas condições experimentais reais. Ver Meyer, P. L. 1977. Probabilidade: aplicações à estatística. RJ, LTC.
4. Apliquei um teste-G para checar, de modo conservador (no sentido de favorecer a hipótese nula de que as diferenças não eram significativas), o grau de discrepância entre as colunas de resultados esperados e observados da Tabela 1. O valor obtido para G (14,10081) é significativo ao nível de 5%, quando comparado ao valor crítico (14,067) de uma distribuição qui-quadrado com sete graus de liberdade. Sobre o teste-G, ver Sokal, R. R. & Rohlf, F. J. 1981. Biometry: the principles and practice of statistics in biological research, 2nd edition. San Francisco, Freeman; ou Zar, J. H. 1996. Biostatistical analysis, 3rd edition. Upper Saddle River, Prentice. Para os valores críticos da distribuição qui-quadrado, consultei a tabela que há neste último livro.
5. A propósito, meu número estava no intervalo 601-700.
6. A quantidade de peças no interior da urna diminuiu progressivamente, passando de 754 (início) a 675 (imediatamente antes que a octogésima e última peça fosse retirada). Houve posteriormente um 'sorteio de consolação' (cujos resultados não foram aqui considerados), no qual mais 10 peças foram retiradas; essas 10 crianças formariam então uma espécie de fila de espera, no caso de haver desistências entre as 80 primeiras.



Portada | Iberoamérica | Internacional | Derechos Humanos | Cultura | Ecología | Economía | Sociedad | Ciencia y tecnología | Directorio | Redacción