Arquivo da tag: placares

Resultados repetidos

Lendo na internet os poucos blogs que encontrei a respeito da Lotogol (os links estão ao lado, deixem sugestões nos comentários!), notei como a maioria dos jogadores que fazem fechamentos filtram resultados repetidos. É evidente como isto diminua as chances (inclusive aquelas do “famoso” concurso n. 67 de 19/05/2003, com cinco 1×1), mas é uma das melhores práticas possíveis, inclusive porque muitos jogadores não fazem isto, com o resultado da diluição do monteprêmio (baste pensar que o mesmo concurso n. 67 teve incríveis 2.287 vencedores nas 5 faixas, que receberam “apenas” R$ 69,72 (menos que alguns pagamentos em 3 faixas de outros concursos).

Mas afinal, quais resultados deveriam ser filtrados? Talvez dois 4+ a 4+ soem realmente improváveis, mas o que dizer de dois 1 a 1, o placar mais comum? Elaborei a tabela abaixo pra estudar estas probabilidades, mas outra vez sou forçado a lembrar os leitores (e o blog acabou de receber suas primeiras visitas e seu primeiro comentário, obrigado!) como a análise de tais estatísticas assume (1) ou que a probabilidade dos placares de cada partida seja sempre igual, (2) ou que o somatório de todas as partidas tenda à mesma distribuição de probabilidade que podemos derivar dos concursos anteriores da Lotogol.

Placar 0 ocorr. 1 ocorr. 2 ocorr. 3 ocorr. 4 ocorr. 5 ocorr.
1 a 1 54.9677 % 34.9434 % 8.8855 % 1.1297 % 0.0718 % 0.0018 %
1 a 0 57.9743 % 33.3933 % 7.6938 % 0.8863 % 0.0511 % 0.0012 %
2 a 1 59.3119 % 32.6584 % 7.1930 % 0.7921 % 0.0436 % 0.0010 %
2 a 0 67.8653 % 27.3544 % 4.4103 % 0.3555 % 0.0143 % 0.0002 %
0 a 0 72.4196 % 24.1399 % 3.2187 % 0.2146 % 0.0072 % 0.0001 %
1 a 2 72.8067 % 23.8552 % 3.1265 % 0.2049 % 0.0067 % 0.0001 %
0 a 1 73.8208 % 23.1009 % 2.8916 % 0.1810 % 0.0057 % 0.0001 %
2 a 2 75.4030 % 21.9005 % 2.5444 % 0.1478 % 0.0043 % 0.0000 %
3 a 1 78.4428 % 19.5160 % 1.9422 % 0.0966 % 0.0024 % 0.0000 %
3 a 0 82.2618 % 16.3805 % 1.3047 % 0.0520 % 0.0010 % 0.0000 %
0 a 2 83.1207 % 15.6547 % 1.1793 % 0.0444 % 0.0008 % 0.0000 %
4+ a 0 85.1235 % 13.9338 % 0.9123 % 0.0299 % 0.0005 % 0.0000 %
1 a 3 85.5640 % 13.5501 % 0.8583 % 0.0272 % 0.0004 % 0.0000 %
3 a 2 85.7849 % 13.3569 % 0.8319 % 0.0259 % 0.0004 % 0.0000 %
4+ a 1 86.4504 % 12.7722 % 0.7548 % 0.0223 % 0.0003 % 0.0000 %
2 a 3 88.2452 % 11.1743 % 0.5660 % 0.0143 % 0.0002 % 0.0000 %
4+ a 2 91.0396 % 8.6271 % 0.3270 % 0.0062 % 0.0001 % 0.0000 %
0 a 3 91.9710 % 7.7625 % 0.2621 % 0.0044 % 0.0000 % 0.0000 %
0 a 4+ 92.6746 % 7.1042 % 0.2178 % 0.0033 % 0.0000 % 0.0000 %
1 a 4+ 93.1460 % 6.6607 % 0.1905 % 0.0027 % 0.0000 % 0.0000 %
3 a 3 93.8568 % 5.9884 % 0.1528 % 0.0020 % 0.0000 % 0.0000 %
2 a 4+ 94.3330 % 5.5355 % 0.1299 % 0.0015 % 0.0000 % 0.0000 %
4+ a 3 95.5321 % 4.3866 % 0.0806 % 0.0007 % 0.0000 % 0.0000 %
3 a 4+ 98.2622 % 1.7256 % 0.0121 % 0.0000 % 0.0000 % 0.0000 %
4+ a 4+ 98.5090 % 1.4821 % 0.0089 % 0.0000 % 0.0000 % 0.0000 %

(nenhuma probabilidade, como cinco 4+ a 4+, é efetivamente nula, mas os valores são muito pequenos e exigiriam dezenas de casas decimais para figurar)

Do que derivamos alguns fatos interessantes:

  • A certeza da ocorrência de qualquer resultado em particular é muito pequena; mesmo o 1 a 1, o placar mais comum, tem 54% de probabilidade de não ocorrer em um dado concurso;
  • A filtragem é uma idéia interessante, mas talvez valha mais a pena fazê-la por porcentagem de probabilidade e não por alguma regra abstrata (como “nenhum placar deve ocorrer mais de uma vez no cartão”) — exemplo disto é o fato de que mesmo dois 3 a 1 em um mesmo concurso, placar não tão comum, serem mais comuns que um único 4+ a 4+;
  • Querendo definir efetivamente uma “regra de filtragem”, a princípio a melhor escolha seria não permitir nenhum resultado repetido, ao máximo abrindo campo para o 1 a 1, o 1 a 0 e o 2 a 1.

Voltaremos a trabalhar com estas tabelas, mas antes será interessante analisar o concurso deste domingo, improvável estatística e desportivamente — e de certa forma corolário àquilo que tenho começado a defender aqui.

Porque não apostar na freqüência

Como dito nos posts anteriores, apostar na freqüência dos resultados fornece uma boa probabilidade a médio/longo prazo de se obter algum dos prêmios, mas é certamente inviável do ponto de vista financeiro. Fica comprovado, assim, que o comportamento das partidas e dos concursos anteriores pode até ser considerado na hora da aposta, mas é um fator secundário à análise dos times em questão.

Se considerarmos os três placares mais comuns (1 a 1, 1 a 0 e 2 a 1) para montar um sistema de apostas, obtemos um fechamento completo de 243 cartões (3 placares possíveis em cinco partidas, 3⁵=243) — sobre fechamentos e desdobramentos para a Lotogol e a Loteca discutirei depois. Aplicando estes 243 cartões aos 397 concursos já realizados (com um custo de R$ 121,50 por concurso, ou R$ 48.235,50 ao todo) obteríamos resultados decepcionantes:

Cartões com… Número de cartões Porcentagem
0 acertos 55.486 57,52 %
1 acerto 32.317 33,50 %
2 acertos 7.693 7,97 %
3 acertos 899 0,93 %
4 acertos 74 0,08 %
5 acertos 2 0,00 %

Ou, para precisar os pontos principais:

  • Mesmo com alguns ganhos, que estão longe de ser “muito prováveis”, financeiramente seria um “investimento” muito arriscado para a baixa expectativa de retorno (volto a lembrar: mesmo as loterias esportivas são jogos, e portanto devem ser usadas com fins de diversão e não de esperança de retorno financeiro), inclusive pelo fato de, nos casos em que se obtém algum prêmio, este ser geralmente dividido com muitos apostadores;
  • Em mais da metade dos casos, este tipo de aposta não teria acertado um único placar, com apenas 1,01% de cartões premiados;
  • Seria uma aposta estúpida: a todos os efeitos, estaríamos anulando as diferenças entre a Lotogol e as demais loterias, desprezando exatamente nossa vantagem: o conhecimento do futebol (e mesmo a própria análise de comportamentos anteriores: apesar de um dos cartões premiados ter sido uma repetição de cinco 1×1, a maioria dos apostadores filtraria cartões deste tipo — caberia discutir se as partidas de futebol são eventos independentes ou não, mas para efeitos práticos de aposta diria que não temos como considerar de outra forma).

E agora a essência disto tudo: a verificação acima apresenta um problema de base muito grave: os testes foram executados sobre os mesmos dados de onde foram retirados. Pode parecer trivial, mas não o é: aplicar um modelo sobre os mesmos dados de onde foi treinado é uma falha estatística conhecida e deveria ser omitida sempre que possível. Pense um pouco: como fizemos para saber que os placares mais comuns são 1×1, 1×0 e 2×1? Computamos os dados de todos os concursos anteriores da Lotogol. Deveria ser evidente como, procurando uma segunda vez em todos os concursos anteriores da Lotogol, os resultados mais comuns sejam mais uma vez… 1×1, 1×0 e 2×1.

É um problema conhecido na lingüística computacional: os sistemas que fazem os processamento de textos são evidentemente treinados sobre um grupo de textos (por exemplo, todas as edições de um determinado jornal entre janeiro e setembro), mas a verificação de sua qualidade deve ser feita aplicando-se os modelos a um grupo de textos similar mas diferente (por exemplo, todas as edições do mesmo jornal entre outubro e dezembro).

Em nosso caso, reduzir o número de concursos seria difícil pois a Lotogol é uma loteria nova e, como não sabemos os critérios da Caixa para a escolha das partidas que compõem cada concurso (ou mesmo se há critérios), o melhor exemplo são exatamente as edições anteriores. A única alternativa concreta — a menos que o apostador assuma que realmente todos os placares têm sempre a mesma probabilidade para todas as partidas — seria elaborar as contagens sobre todos os jogos das últimas edições dos campeonatos que a Caixa costuma incluir (desconsiderando campeonatos como a Premier League inglesa ou a Serie A italiana, que nunca figuram) e aplicar os modelos destas contagens aos resultados da Lotogol. É uma alternativa melhor apesar de ainda apresentar algumas lacunas estatísticas, que será feita nos próximos posts.

Em suma: não trate a Lotogol como um jogo unicamente de sorte, mas valorize seu aspecto fundamental que é espelhar a realidade do futebol.

Distribuição de placares

A diferença entre as loterias esportivas e as de sorteio é o fato de se poder prever, em maior ou menor medida, qual será o resultado das primeiras ou, visto de outra forma, quais resultados são mais ou menos prováveis.

O mais belo e conhecido exemplo da Teoria do caos

A discussão sobre esta “previsão” seria filosófica e matematicamente interessante. Antes de tudo, não há como afirmar categoricamente se uma partida de futebol constitui um evento determinístico ou indeterminístico (de certa forma, se dadas exatamente as mesmas condições — esportivas, psicológicas, meteorológicas etc. — o resultado final seria sempre o mesmo ou não); além disto, mesmo que se pudesse provar ser um evento determinístico, seria indiscutivelmente um de tipo caótico (no sentido efetivo, e não quase místico dado por alguns apostadores de loterias, da teoria do caos). Para nós, isto significa que, não importando o tipo de evento que realmente seja (e eu o teria por indeterminístico), a conseqüência prática é a mesma: a impossibilidade, como para qualquer loteria, de calcular qual será o resultado final.

Esta impossibilidade não exclui, contudo, os efeitos de uma análise desportiva de cada evento: o apostador pode jogar o placar que bem lhe interesse, talvez na busca exatamente da zebra, mas sabe que no confronto entre um segundo colocado buscando a liderança e um desmotivado e já rebaixado último colocado há uma tendência de resultado favorável ao primeiro. Esta tendência, apesar de indiscutível para a maioria dos desportistas, poderia ser contestada por alguns matemáticos e será devidamente explorada.

Seguindo esta última linha, poderíamos analisar a Lotogol como se fosse uma simples loteria, na qual deve-se acertar dois resultados entre 0 e 4 para o acerto de uma “faixa” (de um placar), obtendo o prêmio mínimo com o acerto de 3 faixas sobre 5. Qualquer pessoa que conheça um mínimo de futebol dirá que esta posição é absurda: não apenas estamos considerando que todos os placares têm a mesma probabilidade (1×0 sendo tão comum quanto um 4×4) mas, sobretudo, estamos dizendo que em qualquer partida a probabilidade dos placares seria sempre a mesma (ou seja, que entre uma seleção campeã do mundo contra um time amador as probabilidades de resultados finais são exatamente as mesmas que entre dois times de um mesmo campeonato empatados na tabela).

Ainda assim, começando nosso estudo pelo ponto de vista lotérico, é imediato como se trataria de uma loteria viciada: em outras palavras, jogar na Lotogol seria análogo ao apostar no resultado do lançamento de um dado viciado (aquele com peso desequilibrado no qual um dos lados sai com mais freqüências que os demais). Se fosse uma loteria justa, assumindo um universo de 25 placares possíveis (5², ou seja cinco quantidades de gols possíveis em duas posições, para o time mandante e visitante) cada placar teria uma probabilidade de 1/25 ou exatos 4%, valor ao qual tende o “sorteio” de cada placar. Contudo, se formos computar os resultados já obtidos até o presente concurso (n. 397)…

O sinal de “+” nos placares refere-se ao tipo de aposta da Lotogol (na qual aposta-se em “4 ou mais gols” de um time, 5×5 sendo a todos os efeitos equivalente a 4×4).

Como esperado pelo conhecimento desportivo, alguns placares costumam aparecer com mais freqüência que outros, em particular o 1×1, o 1×0 e 2×1 (confirmando uma vantagem para os times que jogam em casa). Poderia-se alegar que as 1985 partidas computadas (5 para cada concurso) ainda são poucas para se ter uma idéia precisa da distribuição no caso de se tratar de uma loteria não viciada; veremos isto depois.

A tabela dos resultados pode ajudar a se ter uma visão mais precisa do todo:

Placar Porcentagem de ocorrência
0 a 0 6,25 %
0 a 1 5,89 %
0 a 2 3,63 %
0 a 3 1,66 %
0 a 4+ 1,51 %
1 a 0 10,33 %
1 a 1 11,28 %
1 a 2 6,15 %
1 a 3 3,07 %
1 a 4+ 1,41 %
2 a 0 7,46 %
2 a 1 9,92 %
2 a 2 5,49 %
2 a 3 2,47 %
2 a 4+ 1,16 %
3 a 0 3,83 %
3 a 1 4,74 %
3 a 2 3,02 %
3 a 3 1,26 %
3 a 4+ 0,35 %
4+ a 0 3,17 %
4+ a 1 2,87 %
4+ a 2 1,86 %
4+ a 3 0,91 %
4+ a 4+ 0,30 %

Um sorteio viciado, se diria, mas não a ponto de ser fácil de ser vencido; mesmo um resultado como 4+ a 4+, aparentemente tão incomum,com um intervalo de confiança de 95% é esperado em 1 partida a cada 990, ou um concurso a 198 (com um intervalo de confiança de 75%, a espera é de apenas 1 em cada 95 partidas, ou 19 concursos). Da mesma forma, a idéia que muitos já tiveram de apostar continuamente nos resultados mais freqüentes (como apenas no 1×1, ou em todas as 3⁵= 243 combinações possíveis entre 1×1, 1×0 e 2×1) daria efetivamente boas probabilidades de obter algum prêmio a médio/longo prazo, mas é totalmente ineficaz do ponto de vista financeiro (você iria, sim, receber algum prêmio, mas teria gasto uma quantia superior na busca do mesmo).

Continuarei a analisar estes dados nos próximos posts.