Pausa…

Voltaremos no final de fevereiro, esperando que a Lotogol e a Loteca ainda não tenham mudado até lá!

A agonia das loterias esportivas?

A notícia da semana sobre as mudanças nas loterias esportivas (Loteca e Lotogol) continua a repercutir, com discussões no Orkut e em comentários de blogs. Tudo continua vago, pois as declarações dos dirigentes da Caixa pouco indicaram sobre quais serão, efetivamente, as mudanças e quando acontecerão.

A notícia, como eu havia comentado, não chega a ser inesperada. Em junho do ano passado, Pietro Veronese assinava um artigo na “La Repubblica” (o maior jornal italiano) com o sugestivo título de “Con il Totocalcio in agonia scompare un pezzo d’Italia” (“Com o Totocalcio — a Loteca de lá — em agonia desaparece um pedaço da Itália”). O desolador cenário descrito, com a queda vertiginosa dos vértices dos anos ’50-’60 e uma manutenção sofrida até os anos ’90, a conseqüente diminuição dos monteprêmios, o desaparecimento das referências à loteria na linguagem do dia-a-dia e principalmente a dupla concorrência das loterias de pura sorte (a Superenalotto e a WinForLife) e das apostas on-line (da própria Sisal italiana, da Bwin, etc. etc.) é incrivelmente similar ao brasileiro. Substituam a Aams pela Caixa Econômica Federal, o Totocalcio pela Loteria Esportiva, a Superenalotto pela Megasena, dêem uma aparada nas datas e pronto: em linhas gerais está traçado nosso cenário.

Fato é que estas mudanças são de origem administrativa e social. Administrativa, porque os organizadores das loterias mostraram gradualmente uma preferência pelas loterias de pura sorte, principalmente quando o rateio é composto de poucos prêmios milionários (não de raro acumulados) inclusive por não se mostrarem capazes (e no caso do Brasil, pela impossibilidade legal e técnica) de fazer frente aos sites de apostas. Social, porque por mais que se preguem milagres econômicos (tanto aqui quanto lá), a percepção das diferenças sociais/econômicas dentro da população (principalmente quanto são entendidas como não merecidas) favorecem exatamente este tipo de loteria no qual o valor de um prêmio passa a contar mais que a chance de obtê-lo. É uma afirmação difícil de comprovar, eu sei, mas uma análise histórica diacrônica (as loterias ao longo da história, e o sucesso do Totocalcio na Itália pós-guerra e da Loteria esportiva no Brasil do milagre econômico) e sincrônica (os bingos em família, onde muito mais que o prêmio conta vencer os parentes e amigos) parece comprová-lo.

A maioria dos apostadores preferiria jogos de sorte com altíssimos mas improváveis prêmios, nos quais o conhecimento do assunto (o futebol) não faria diferença até pelo arrefecimento do convívio social que o motivava (como os tios que se juntavam ao final do churrasco para conferir suas diferentes apostas que haviam sido discutidas durante a semana). Neste sentido, faz algum sentido a alegação da CEF de que estas loterias “envelheceram”, mas como será o tal “rejuvenescimento”? Temos certeza de que não será o vestir um idoso com roupas de adolescente, não apenas tornando-o incapaz mas privando-o de toda sua história?

O que a Caixa deveria entender, ou talvez melhor “admitir”, é que mais do que nunca o perfil do apostador em jogos de sorte e de habilidade é diferente. Quem deseja grandes prêmios só pelo preencher um volante não irá passar às loterias esportivas; quem deseja se divertir com seus conhecimentos esportivos não irá confundir a Timemania com uma loteria esportiva. Ao máximo, e o que parece ser provável, este último grupo migrará em parte para as apostas on-line, não apenas privando a Caixa e o Ministério dos Esportes de seu financiamento indireto, mas efetivamente enviando dinheiro para fora do país.

E não se trata de imaginar que não há alternativas: baste ver o caso da La Quiniela na Espanha, uma loteria esportiva que ainda segue forte. Além de consultar os apostadores da Loteca e da Lotogol sobre o que realmente desejariam, creio que a Caixa deveria considerar os seguintes pontos:

  • Divulgar e garantir as apostas; a propaganda das loterias geralmente esquece por completo das loterias esportivas e nem é raro chegar em alguma casa lotérica e simplesmente não encontrar volantes para alguma destas (aconteceu comigo esta semana, com a Lotogol — felizmente uma lotérica a 200 metros tinha uns 40 volantes disponíveis);
  • Entender que não poderia nem deveria competir com as apostas on-line: nestas basta ao apostador acertar um critério (resultado, gols…) em um jogo de sua escolha num universo de centenas; na loteria esportiva trata-se de acertar um único critério (1X2 ou placar) em um grupo de jogos que não é de sua escolha;
  • Em função do ponto acima, incluir apenas jogos que efetivamente um apostador médio pode conhecer: incluir jogos do campeonato paraense para apostadores fora do Pará é, efetivamente, reduzir o jogo a uma loteria de sorte — além disto, a inclusão de alguns jogos de ligas européias quando não há jogos importantes no Brasil seria um chamativo não desprezível;
  • Manter o preço da aposta baixo é um fator essencial: o apostador esportivo da Caixa quer ganhar, evidentemente, mas se realmente quiser considerar suas apostas como um investimento migraria para as apostas on-line; o fundamental é o vencer, não tanto o quanto, e por isto o preço da aposta mínima não deveria nunca ultrapassar R$ 1,00 — melhor ainda, deveria ser facultada a chance de apostar quanto se quisesse (neste ponto sim, fazendo concorrência às loterias on-line), grosso modo como funciona atualmente na Lotogol;
  • Oferecer prêmios do rateio a todos os acertos que realmente estão acima de uma média estatística (em função de todos os apostadores) e probabilística (calculada) de acertos — por exemplo, 12 acertos na Loteca não pagarem nem mesmo quando não há acertadores nas 14 faixas é a dizer pouco ridículo;
  • Novamente, considerar o tipo de apostador e oferecer-lhe todos os dados e vantagens que merece — da mesma forma que nas loterias esportivas européias, por exemplo, seria utilíssimo saber quantos apostadores apostaram em cada placar ao final do concurso, bem como seria de extrema utilidade dar alguma noção sobre os critérios para escolha das partidas;
  • Lembrar sempre como para a Caixa e para o Ministério dos Esportes é simplesmente impossível não ganhar dinheiro com as loterias esportivas havendo um mínimo de apostadores — vale muito mais manter estes por perto, para gradualmente aplicar as mudanças necessárias, do que simplesmente extinguir as loterais esportivas esperando uma migração completa para as loterias de aposta.

Adoraria ouvir as sugestões dos demais, deixem comentários aqui em baixo, por favor.

Fechamentos e desdobramentos para a Lotogol

A diferença entre um “fechamento” e um “desdobramento” parece não ser sempre clara:

  • um fechamento é um grupo de apostas que cobre todas as possibilidades de resultado estimadas; para a Lotogol, por exemplo, um fechamento completo, que cobriria todos os resultados possíveis das cinco partidas em jogo, seria constituído por 25⁵ apostas, ou 9.765.625 cartões; um fechamento para os três placares mais comuns em todas as partidas, como vimos, seria constituído por 3⁵ apostas, ou 243 cartões.
  • um desdobramento é um grupo de apostas que cobre um acerto mínimo dentro das possibilidades de resultado estimadas; se por exemplo continuo querendo apostar somente nos três placares mais comuns mas quero simplesmente um grupo de cartões que me garanta ao menos um acerto de três faixas, posso fazê-lo com 13 ou possivelmente menos cartões (o número não é exato e, na verdade, desconhecido, como veremos a seguir).

É importante não confundir um fechamento filtrado (do qual se retiram, por exemplo, todos os cartões com mais de dois placares repetidos) e um desdobramento (que, se filtrado, anularia todas as vantagens dos desdobramentos, deixando-nos apenas as desvantagens).

O conceito é muito conhecido nos jogos de sorte, mas não é tão aplicado nas loterias esportivas pelo tipo de sorteio (se forem consideradas como normais loterias, as esportivas seriam o equivalente de um sorteio onde as bolas voltam para o globo após cada extração). Um conceito derivado que é muito utilizado é o das “chaves” na Loteca, que permite se aproveitar também das apostas duplas e triplas.

A diferença entre as duas loterias esportivas está no tamanho e no número de possibilidades: se na Loteca temos três possibilidades (1, X, 2) repetidas quatorze vezes (3^14 = 4.782.969), na Lotogol temos vinte e cinco possibilidades repetidas cinco vezes (25⁵ = 9.765.625). A montagem de desdobramentos entre as duas acaba sendo muito diferenciada, inclusive porque a própria técnica do desdobramento (o wheeling) é em verdade uma aplicação de um campo matemático muito complexo chamado minimum set covering.

Mas chega de teoria. Como nas definições acima, vamos imaginar que estou assumindo que em todos os  cinco jogos do próximo concurso da Lotogol teremos um entre os três placares mais comuns (a saber, 1×1, 1×0 e 2×1). Um fechamento exigiria 243 apostas, mas seria possível montar um desdobramento (com um número menor de apostas, evidentemente) que me garantisse acertar no mínimo três faixas se os  jogos terminarem com um placar entre aqueles que havíamos previsto?

Escrevi um programa para buscar estes fechamentos, e ele rapidamente encontrou uma solução com 13 cartões. Assumindo que A, B, C, D e E sejam as cinco partidas em jogo e 1, 2 e 3 os índices dos placares tidos como possíveis (de forma que, por exemplo, A1 signifique “1×1 no primeiro jogo”, B2 “1×0 no segundo jogo” e E3 “2×1 no quinto jogo”), o seguinte grupo de apostas garante no mínimo três acertos (cobrindo quatro acertos em 44% dos casos e cinco acertos em 5% dos casos) desde que os placares finais das partidas efetivamente estejam entre aqueles que previmos:

(retirei o modelo ao menos até o final de fevereiro, depois penso se irei mantê-los — deveria ser evidente como um desdobramento só garante acertos se você acertar os placares das partidas, reclamar sobre os poucos pontos é, no mínimo, ridículo)

Os desdobramentos são um instrumento utilíssimo para o apostador que realmente saiba prever o resultado dos jogos: mesmo que tenhamos palpites bastante elaborados (como uma dupla de placares possíveis para um jogo, três triplas e mesmo uma quíntupla) podemos garantir algum acertos desde que os placares finais estejam entre os previstos. Não é nenhuma fórmula mágica para fabricar dinheiro (mesmo que o fosse, é matematicamente impossível “quebrar” esta loteria, o que deixa ainda mais desgosto pela vontade da Caixa de acabar com a mesma) mas um método consciente para maximizar as chances de quem realmente sabe prever os resultados de uma partida. Para os curiosos, este sistema com uma dupla, três triplas e uma quíntupla também pode ser garantido com apenas 13 cartões; mesmo um complexo sistema com duas duplas e três quíntuplas pode ser garantido para três acertos com apenas 20 cartões.

Voltaremos a este assunto.


Atualização (19/01/2010, 16h56): Consegui reduzir o sistema acima para 11 cartões! Interessados entrem em contato.

Mudanças nas loterias

Pesquei no Aposte na sorte e confirmei em alguns jornais, como na Folha Online:

A Caixa Econômica Federal informou nesta segunda-feira que haverá mudanças nos jogos das loterias neste ano. Segundo o vice-presidente de fundos de governo e loterias da Caixa, Moreira Franco, haverá mudanças na Instantânea, Dupla Sena, Lotofácil, Timemania, Loteca e Lotogol. […] Franco disse que a Caixa pretende fazer mudanças em três produtos devido a queda de apostas: Timemania, Loteca e Lotogol. “Existem alguma modificações a serem feitas nestes três produtos, para gerar uma melhoria. Eles envelheceram e precisam ser modernizados. Já conversamos com o ministro dos Esportes e esperamos em breve chegar a um produto ligado ao futebol com um melhor desempenho.”

Além disto, está anunciado um plano a médio prazo para implementar apostas via internet.

A notícia é de deixar um pouco perplexo, mas infelizmente esperada. Há alguns anos a Caixa vem demonstrando cada vez menos interesse nas loterias esportivas, alimentando um círculo de pouca divulgação pela pouca procura. É verdade que as três loterias em questão (a Lotogol que é a “prima pobre” das loterias brasileiras, a Loteca e a Timemania que nada tem de loteria esportiva) estão abaixo das expectativas da Caixa, mas a administração dos últimos anos não deixa esperar pelo melhor.

A postura adotada pelas Loterias Federais são bem explicadas no slogan “Para a sorte, todo mundo é igual”, que nos últimos meses parece ter sido menos explorado. Aliado ao fato de que a quantia destinada ao rateio é sempre consideravelmente pequena e sobretudo à péssimo e crescente prática de favorecer jogos com poucos prêmios de centenas de milhões de reais, é de se imaginar que o tal “rejuvenescimento” não passe de uma assimilação das três loterias à Timemania, uma desculpa do governo para ajudar times endividados por cartolas antigos ou atuais. Nada de diversão a bom custo (a aposta da Lotogol ainda é a menor) na qual o conhecimento do futebol realmente ajude, apenas sorteios e mais sorteios no Caminhão da Sorte.

Uma eventual extinção das loterias esportivas seria uma perda inútil, ainda mais contando como o rateio do valor arrecadado (sem prêmios fixos) garante que a Caixa (e por extensão o Ministério dos Esportes) nunca perca dinheiro. Todos os apostadores da Loteca sonham com uma divisão mais similar à do Totocalcio italiano (de onde parece ter “nascido” nossa antiga Loteria Esportiva), onde os 12 acertos também são pagos. Lembrando que a legislação brasileira proibiria (e com razão) à Caixa a prática de um bookmarking efetivo.

Cabe-nos apenas esperar, torcendo para que não sejamos substraídos destes jogos belos, simples e divertidos.

Concurso Lotogol n. 398

Marco Antônio (Portuguesa) comemora gol diante do São Paulo (fonte: g1.com.br)

O concurso deste domingo foi interessante para confirmar dois pontos que tenho defendido: (1) é fundamental tratar a Lotogol e a Lotoca como loterias esportivas, e não como meras loterias (o resultado da Lotogol em particular era de baixa probabilidade: usando as tabelas abaixo, teríamos 0,000000052% de probabilidade, ou uma chance em 19.230.769); (2) ao mesmo tempo é necessário considerar os eventos caóticos, em maior ou menor medida, que são estes jogos e portanto tratá-los como meras loterias (em outras palavras, se não temos palpites para todos os jogos, o melhor é não jogar).

Jogo a jogo:

  • Flamengo 3 x 2 Duque de Caxias – o Flamengo sofreu para bater o Duque de Caxias e, apesar de assegurar a vitória que se imaginava, forneceu também um placar elástico, no limite da “zebra”. Em verdade não era uma aposta de todo improvável: além de estar desfalcado de seus principais jogares (Juan, Léo Moura, Ronaldo Angelim, Petkovic e Adriano), o atual campeão brasileiro enfrentou um time que vai disputar a série B este ano — se as casas de aposta davam o Flamengo como franco-favorito, talvez estivessem pesando em excesso o título recém conquistado.
  • São Paulo 1 x 3 Portuguesa – uma das verdadeiras zebras da rodada, não apenas pela vitória da Portuguesa, como pela vantagem de dois gols.
  • CRAC 1 x 0 Goiás – a outra grande zebra da rodada, o Esmeraldino foi vencido não apenas pelo gol contra de Fernandão, mas pela péssima atuação da equipe no geral. O Goiás parece sentir a saída de seus principais jogadores (Iarley, Leandro Euzébio, Fernando, Júlio César) e caso não mostre logo forças de recuperação não deverá mais ser considerado grandíssimo favorito para todos os jogos.
  • Joinville 3 x 0 Criciúma – confesso que pouco sabia sobre este jogo, contudo nos últimos anos o Joinville tinha em geral se demonstrado superior no clássico e a vantagem de ser o mandante nunca deve ser desprezada. Inesperado, de fato, foi o placar elástico de 3 x 0 para um time que, segundo havia lido, havia decidido adotar uma escalação mais defensiva para o início do campeonato.
  • Colo Colo 1 x 5 Bahia – a vitória do Bahia era esperada, mas novamente a goleada por 1 x 4+ não era o mais indicado para a estréia de Renato Gaúcho no comando do Tricolor baiano.

A CEF ainda não divulgou os vencedores e o rateio do concurso, mas é de se esperar que mesmo os acertados de três faixas não tenham sido numerosos. O concurso foi quase anormal, pelo comportamento dos anteriores: entre os fatores princiapis, um único jogo teve menos de 3 gols, e dois visitantes venceram por mais de 2 gols de diferença. Também não tivemos nenhum empate.

Acompanhar gradualmente, e não apenas observando o histórico, esta loteria mostrou-se útil antes de quanto se esperasse. Antes de entrar no âmbito propriamente desportivo, vamos analisar mais um pouco do ponto de vista puramente estatístico; já fica a pergunta: um único jogo ter menos de 3 gols é muito improvável?

Resultados repetidos

Lendo na internet os poucos blogs que encontrei a respeito da Lotogol (os links estão ao lado, deixem sugestões nos comentários!), notei como a maioria dos jogadores que fazem fechamentos filtram resultados repetidos. É evidente como isto diminua as chances (inclusive aquelas do “famoso” concurso n. 67 de 19/05/2003, com cinco 1×1), mas é uma das melhores práticas possíveis, inclusive porque muitos jogadores não fazem isto, com o resultado da diluição do monteprêmio (baste pensar que o mesmo concurso n. 67 teve incríveis 2.287 vencedores nas 5 faixas, que receberam “apenas” R$ 69,72 (menos que alguns pagamentos em 3 faixas de outros concursos).

Mas afinal, quais resultados deveriam ser filtrados? Talvez dois 4+ a 4+ soem realmente improváveis, mas o que dizer de dois 1 a 1, o placar mais comum? Elaborei a tabela abaixo pra estudar estas probabilidades, mas outra vez sou forçado a lembrar os leitores (e o blog acabou de receber suas primeiras visitas e seu primeiro comentário, obrigado!) como a análise de tais estatísticas assume (1) ou que a probabilidade dos placares de cada partida seja sempre igual, (2) ou que o somatório de todas as partidas tenda à mesma distribuição de probabilidade que podemos derivar dos concursos anteriores da Lotogol.

Placar 0 ocorr. 1 ocorr. 2 ocorr. 3 ocorr. 4 ocorr. 5 ocorr.
1 a 1 54.9677 % 34.9434 % 8.8855 % 1.1297 % 0.0718 % 0.0018 %
1 a 0 57.9743 % 33.3933 % 7.6938 % 0.8863 % 0.0511 % 0.0012 %
2 a 1 59.3119 % 32.6584 % 7.1930 % 0.7921 % 0.0436 % 0.0010 %
2 a 0 67.8653 % 27.3544 % 4.4103 % 0.3555 % 0.0143 % 0.0002 %
0 a 0 72.4196 % 24.1399 % 3.2187 % 0.2146 % 0.0072 % 0.0001 %
1 a 2 72.8067 % 23.8552 % 3.1265 % 0.2049 % 0.0067 % 0.0001 %
0 a 1 73.8208 % 23.1009 % 2.8916 % 0.1810 % 0.0057 % 0.0001 %
2 a 2 75.4030 % 21.9005 % 2.5444 % 0.1478 % 0.0043 % 0.0000 %
3 a 1 78.4428 % 19.5160 % 1.9422 % 0.0966 % 0.0024 % 0.0000 %
3 a 0 82.2618 % 16.3805 % 1.3047 % 0.0520 % 0.0010 % 0.0000 %
0 a 2 83.1207 % 15.6547 % 1.1793 % 0.0444 % 0.0008 % 0.0000 %
4+ a 0 85.1235 % 13.9338 % 0.9123 % 0.0299 % 0.0005 % 0.0000 %
1 a 3 85.5640 % 13.5501 % 0.8583 % 0.0272 % 0.0004 % 0.0000 %
3 a 2 85.7849 % 13.3569 % 0.8319 % 0.0259 % 0.0004 % 0.0000 %
4+ a 1 86.4504 % 12.7722 % 0.7548 % 0.0223 % 0.0003 % 0.0000 %
2 a 3 88.2452 % 11.1743 % 0.5660 % 0.0143 % 0.0002 % 0.0000 %
4+ a 2 91.0396 % 8.6271 % 0.3270 % 0.0062 % 0.0001 % 0.0000 %
0 a 3 91.9710 % 7.7625 % 0.2621 % 0.0044 % 0.0000 % 0.0000 %
0 a 4+ 92.6746 % 7.1042 % 0.2178 % 0.0033 % 0.0000 % 0.0000 %
1 a 4+ 93.1460 % 6.6607 % 0.1905 % 0.0027 % 0.0000 % 0.0000 %
3 a 3 93.8568 % 5.9884 % 0.1528 % 0.0020 % 0.0000 % 0.0000 %
2 a 4+ 94.3330 % 5.5355 % 0.1299 % 0.0015 % 0.0000 % 0.0000 %
4+ a 3 95.5321 % 4.3866 % 0.0806 % 0.0007 % 0.0000 % 0.0000 %
3 a 4+ 98.2622 % 1.7256 % 0.0121 % 0.0000 % 0.0000 % 0.0000 %
4+ a 4+ 98.5090 % 1.4821 % 0.0089 % 0.0000 % 0.0000 % 0.0000 %

(nenhuma probabilidade, como cinco 4+ a 4+, é efetivamente nula, mas os valores são muito pequenos e exigiriam dezenas de casas decimais para figurar)

Do que derivamos alguns fatos interessantes:

  • A certeza da ocorrência de qualquer resultado em particular é muito pequena; mesmo o 1 a 1, o placar mais comum, tem 54% de probabilidade de não ocorrer em um dado concurso;
  • A filtragem é uma idéia interessante, mas talvez valha mais a pena fazê-la por porcentagem de probabilidade e não por alguma regra abstrata (como “nenhum placar deve ocorrer mais de uma vez no cartão”) — exemplo disto é o fato de que mesmo dois 3 a 1 em um mesmo concurso, placar não tão comum, serem mais comuns que um único 4+ a 4+;
  • Querendo definir efetivamente uma “regra de filtragem”, a princípio a melhor escolha seria não permitir nenhum resultado repetido, ao máximo abrindo campo para o 1 a 1, o 1 a 0 e o 2 a 1.

Voltaremos a trabalhar com estas tabelas, mas antes será interessante analisar o concurso deste domingo, improvável estatística e desportivamente — e de certa forma corolário àquilo que tenho começado a defender aqui.

Porque não apostar na freqüência

Como dito nos posts anteriores, apostar na freqüência dos resultados fornece uma boa probabilidade a médio/longo prazo de se obter algum dos prêmios, mas é certamente inviável do ponto de vista financeiro. Fica comprovado, assim, que o comportamento das partidas e dos concursos anteriores pode até ser considerado na hora da aposta, mas é um fator secundário à análise dos times em questão.

Se considerarmos os três placares mais comuns (1 a 1, 1 a 0 e 2 a 1) para montar um sistema de apostas, obtemos um fechamento completo de 243 cartões (3 placares possíveis em cinco partidas, 3⁵=243) — sobre fechamentos e desdobramentos para a Lotogol e a Loteca discutirei depois. Aplicando estes 243 cartões aos 397 concursos já realizados (com um custo de R$ 121,50 por concurso, ou R$ 48.235,50 ao todo) obteríamos resultados decepcionantes:

Cartões com… Número de cartões Porcentagem
0 acertos 55.486 57,52 %
1 acerto 32.317 33,50 %
2 acertos 7.693 7,97 %
3 acertos 899 0,93 %
4 acertos 74 0,08 %
5 acertos 2 0,00 %

Ou, para precisar os pontos principais:

  • Mesmo com alguns ganhos, que estão longe de ser “muito prováveis”, financeiramente seria um “investimento” muito arriscado para a baixa expectativa de retorno (volto a lembrar: mesmo as loterias esportivas são jogos, e portanto devem ser usadas com fins de diversão e não de esperança de retorno financeiro), inclusive pelo fato de, nos casos em que se obtém algum prêmio, este ser geralmente dividido com muitos apostadores;
  • Em mais da metade dos casos, este tipo de aposta não teria acertado um único placar, com apenas 1,01% de cartões premiados;
  • Seria uma aposta estúpida: a todos os efeitos, estaríamos anulando as diferenças entre a Lotogol e as demais loterias, desprezando exatamente nossa vantagem: o conhecimento do futebol (e mesmo a própria análise de comportamentos anteriores: apesar de um dos cartões premiados ter sido uma repetição de cinco 1×1, a maioria dos apostadores filtraria cartões deste tipo — caberia discutir se as partidas de futebol são eventos independentes ou não, mas para efeitos práticos de aposta diria que não temos como considerar de outra forma).

E agora a essência disto tudo: a verificação acima apresenta um problema de base muito grave: os testes foram executados sobre os mesmos dados de onde foram retirados. Pode parecer trivial, mas não o é: aplicar um modelo sobre os mesmos dados de onde foi treinado é uma falha estatística conhecida e deveria ser omitida sempre que possível. Pense um pouco: como fizemos para saber que os placares mais comuns são 1×1, 1×0 e 2×1? Computamos os dados de todos os concursos anteriores da Lotogol. Deveria ser evidente como, procurando uma segunda vez em todos os concursos anteriores da Lotogol, os resultados mais comuns sejam mais uma vez… 1×1, 1×0 e 2×1.

É um problema conhecido na lingüística computacional: os sistemas que fazem os processamento de textos são evidentemente treinados sobre um grupo de textos (por exemplo, todas as edições de um determinado jornal entre janeiro e setembro), mas a verificação de sua qualidade deve ser feita aplicando-se os modelos a um grupo de textos similar mas diferente (por exemplo, todas as edições do mesmo jornal entre outubro e dezembro).

Em nosso caso, reduzir o número de concursos seria difícil pois a Lotogol é uma loteria nova e, como não sabemos os critérios da Caixa para a escolha das partidas que compõem cada concurso (ou mesmo se há critérios), o melhor exemplo são exatamente as edições anteriores. A única alternativa concreta — a menos que o apostador assuma que realmente todos os placares têm sempre a mesma probabilidade para todas as partidas — seria elaborar as contagens sobre todos os jogos das últimas edições dos campeonatos que a Caixa costuma incluir (desconsiderando campeonatos como a Premier League inglesa ou a Serie A italiana, que nunca figuram) e aplicar os modelos destas contagens aos resultados da Lotogol. É uma alternativa melhor apesar de ainda apresentar algumas lacunas estatísticas, que será feita nos próximos posts.

Em suma: não trate a Lotogol como um jogo unicamente de sorte, mas valorize seu aspecto fundamental que é espelhar a realidade do futebol.

Distribuição de placares II

Talvez ordenando do placar mais comum ao menos comum fique mais fácil seguir as próximas divagações…

Placar Porcentagem de ocorrência
1 a 1 11,28 %
1 a 0 10,33 %
2 a 1 9,92 %
2 a 0 7,46 %
0 a 0 6,25 %
1 a 2 6,15 %
0 a 1 5,89 %
2 a 2 5,49 %
3 a 1 4,74 %
3 a 0 3,83 %
0 a 2 3,63 %
4+ a 0 3,17 %
1 a 3 3,07 %
3 a 2 3,02 %
4+ a 1 2,87 %
2 a 3 2,47 %
4+ a 2 1,86 %
0 a 3 1,66 %
0 a 4+ 1,51 %
1 a 4+ 1,41 %
3 a 3 1,26 %
2 a 4+ 1,16 %
4+ a 3 0,91 %
3 a 4+ 0,35 %
4+ a 4+ 0,30 %

Distribuição de placares

A diferença entre as loterias esportivas e as de sorteio é o fato de se poder prever, em maior ou menor medida, qual será o resultado das primeiras ou, visto de outra forma, quais resultados são mais ou menos prováveis.

O mais belo e conhecido exemplo da Teoria do caos

A discussão sobre esta “previsão” seria filosófica e matematicamente interessante. Antes de tudo, não há como afirmar categoricamente se uma partida de futebol constitui um evento determinístico ou indeterminístico (de certa forma, se dadas exatamente as mesmas condições — esportivas, psicológicas, meteorológicas etc. — o resultado final seria sempre o mesmo ou não); além disto, mesmo que se pudesse provar ser um evento determinístico, seria indiscutivelmente um de tipo caótico (no sentido efetivo, e não quase místico dado por alguns apostadores de loterias, da teoria do caos). Para nós, isto significa que, não importando o tipo de evento que realmente seja (e eu o teria por indeterminístico), a conseqüência prática é a mesma: a impossibilidade, como para qualquer loteria, de calcular qual será o resultado final.

Esta impossibilidade não exclui, contudo, os efeitos de uma análise desportiva de cada evento: o apostador pode jogar o placar que bem lhe interesse, talvez na busca exatamente da zebra, mas sabe que no confronto entre um segundo colocado buscando a liderança e um desmotivado e já rebaixado último colocado há uma tendência de resultado favorável ao primeiro. Esta tendência, apesar de indiscutível para a maioria dos desportistas, poderia ser contestada por alguns matemáticos e será devidamente explorada.

Seguindo esta última linha, poderíamos analisar a Lotogol como se fosse uma simples loteria, na qual deve-se acertar dois resultados entre 0 e 4 para o acerto de uma “faixa” (de um placar), obtendo o prêmio mínimo com o acerto de 3 faixas sobre 5. Qualquer pessoa que conheça um mínimo de futebol dirá que esta posição é absurda: não apenas estamos considerando que todos os placares têm a mesma probabilidade (1×0 sendo tão comum quanto um 4×4) mas, sobretudo, estamos dizendo que em qualquer partida a probabilidade dos placares seria sempre a mesma (ou seja, que entre uma seleção campeã do mundo contra um time amador as probabilidades de resultados finais são exatamente as mesmas que entre dois times de um mesmo campeonato empatados na tabela).

Ainda assim, começando nosso estudo pelo ponto de vista lotérico, é imediato como se trataria de uma loteria viciada: em outras palavras, jogar na Lotogol seria análogo ao apostar no resultado do lançamento de um dado viciado (aquele com peso desequilibrado no qual um dos lados sai com mais freqüências que os demais). Se fosse uma loteria justa, assumindo um universo de 25 placares possíveis (5², ou seja cinco quantidades de gols possíveis em duas posições, para o time mandante e visitante) cada placar teria uma probabilidade de 1/25 ou exatos 4%, valor ao qual tende o “sorteio” de cada placar. Contudo, se formos computar os resultados já obtidos até o presente concurso (n. 397)…

O sinal de “+” nos placares refere-se ao tipo de aposta da Lotogol (na qual aposta-se em “4 ou mais gols” de um time, 5×5 sendo a todos os efeitos equivalente a 4×4).

Como esperado pelo conhecimento desportivo, alguns placares costumam aparecer com mais freqüência que outros, em particular o 1×1, o 1×0 e 2×1 (confirmando uma vantagem para os times que jogam em casa). Poderia-se alegar que as 1985 partidas computadas (5 para cada concurso) ainda são poucas para se ter uma idéia precisa da distribuição no caso de se tratar de uma loteria não viciada; veremos isto depois.

A tabela dos resultados pode ajudar a se ter uma visão mais precisa do todo:

Placar Porcentagem de ocorrência
0 a 0 6,25 %
0 a 1 5,89 %
0 a 2 3,63 %
0 a 3 1,66 %
0 a 4+ 1,51 %
1 a 0 10,33 %
1 a 1 11,28 %
1 a 2 6,15 %
1 a 3 3,07 %
1 a 4+ 1,41 %
2 a 0 7,46 %
2 a 1 9,92 %
2 a 2 5,49 %
2 a 3 2,47 %
2 a 4+ 1,16 %
3 a 0 3,83 %
3 a 1 4,74 %
3 a 2 3,02 %
3 a 3 1,26 %
3 a 4+ 0,35 %
4+ a 0 3,17 %
4+ a 1 2,87 %
4+ a 2 1,86 %
4+ a 3 0,91 %
4+ a 4+ 0,30 %

Um sorteio viciado, se diria, mas não a ponto de ser fácil de ser vencido; mesmo um resultado como 4+ a 4+, aparentemente tão incomum,com um intervalo de confiança de 95% é esperado em 1 partida a cada 990, ou um concurso a 198 (com um intervalo de confiança de 75%, a espera é de apenas 1 em cada 95 partidas, ou 19 concursos). Da mesma forma, a idéia que muitos já tiveram de apostar continuamente nos resultados mais freqüentes (como apenas no 1×1, ou em todas as 3⁵= 243 combinações possíveis entre 1×1, 1×0 e 2×1) daria efetivamente boas probabilidades de obter algum prêmio a médio/longo prazo, mas é totalmente ineficaz do ponto de vista financeiro (você iria, sim, receber algum prêmio, mas teria gasto uma quantia superior na busca do mesmo).

Continuarei a analisar estes dados nos próximos posts.

Iniciando

Instrumentos utilíssimos

Este blog será meu “caderno de anotações” público sobre idéias a respeito de loterias esportivas.

Estamos no âmbito das apostas, portanto, e aqui cabe precisar a diferença muitas vezes esquecida entre “jogos de sorte” (também chamados, por motivos ainda desconhecidos, de “jogos de azar”) e “jogos de aposta”. Entre as loterias oficiais brasileiras, no primeiro e maior grupo estão a Mega Sena, a Quina, a Lotofácil e similares; no segundo encontramos a Loteca (a antiga loteria esportiva) e a Lotogol, meu foco inicial. A Timemania usa fardamento de loteria esportiva, mas também é um jogo de sorte (e nem dos mais favoráveis, apesar de ser relativamente fácil pagar o preço da aposta).

Qual a diferença? Por um lado, seguindo um ponto de vista probabilístico, no primeiro caso as chances de se obter um prêmio são sempre idênticas para toda e qualquer aposta possível; muitos apostadores adotam métodos (entre os mais conhecidos, a atenção aos números em atraso) que aumentariam as possibilidades de ganho, freqüentemente justificando-os com uma matemática bastante particular. É nesta pretensão de defesa matemática que está seu pecado: fato é que, do ponto de vista da ciência como geralmente entendida hoje, esta posição é absurda e, sobretudo, os métodos estatísticos (a análise dos resultados anteriores) não teria validade alguma. Os calculos de probabilidades podem ser utilizados apenas para maximizar as chances dos números preferidos de cada apostador, fechando todas as combinações possíveis entre eles num número de apostas reduzidas.

Jogos de aposta, por outro lado, apresentam possibilidades diferentes para cada resultado (como se tratasse de um dado viciado) que, em linhas gerais, podem ser estimadas por alguém que conheça o esporte em questão, favorecendo-se com o estudo dos comportamentos anteriores. Em suma, caso se possa afirmar com relativa segurança que o time A é favorito sobre o time B, valerá a pena apostar no primeiro. Contudo, isto não significa necessariamente que um jogo de aposta seja mais fácil ou, no gravíssimo erro de considerá-lo do ponto de vista monetário, mais rentável que um jogo de sorte, principalmente no caso das loterias esportivas brasileiras (não é raro que o primeiro prêmio da Lotogol seja bastante inferior ao segundo da Mega Sena, por exemplo).

Assim, estudar a loteria esportiva em suas duas formas (Loteca e Lotogol) pode ser uma bela diversão exatamente por não envolver pura sorte (o ícone do dado para o blog é uma licença de irona) e por permitir esta “caça à zebra” que dá nome à experiência (Equus quagga é o nome científico do bichinho).