O Teorema de Bayes — Parte 1

Desde meados de 2018, nós brasileiros temos a possibilidade de criar núcleos de apologética associados ao ministério do filósofo e teólogo William Lane Craig, e o processo para criar um desses núcleos já foi descrito anteriormente neste portal. Neste texto, quero procurar facilitar a compreensão de um dos questionamentos mais difíceis — talvez o mais difícil — do Guia de Estudo, e que tem suscitado várias dúvidas nas pessoas desejosas de criar seus próprios núcleos de apologética. A maioria desses interessados são pessoas que já exercem algum ministério local, e cujo background é nas ciências humanas. Este texto procurará sanar a eventual dificuldade de lidar com um teorema muito famoso da área de Probabilidade, o Teorema de Bayes.


Como construir um argumento para uma hipótese cristã usando o Teorema de Bayes? Podemos dar como exemplos de hipóteses os dois exemplos a seguir: (1) a hipótese de Jesus ter ressurreto dos mortos, dado que Deus exista; e (2) a hipótese de Jesus ter ressurreto dos mortos, dado que ele apareceu aos discípulos apos sua crucificação. A segunda dessas hipóteses é a mesma que formulei no meu processo de credenciamento junto ao Reasonable Faith em 2017. Para isso, é preciso que entendamos primeiramente o que é o Teorema de Bayes, e qual é a sua finalidade. Nesta publicação, que é a primeira parte do texto completo sobre o Teorema de Bayes, meu objetivo é avaliar a primeira dessas hipóteses.

Introdução à Probabilidade

Antes de falar propriamente do Teorema de Bayes, é preciso entender o que é probabilidade. Se tomarmos o exemplo clássico do uso da probabilidade no nosso cotidiano — um dado de seis faces —, vamos entender com facilidade do que queremos falar.

Imagine que você tenha um dado de seis faces na sua mão. Dados comuns tem suas faces numeradas de 1 a 6, de modo que ao jogá-lo ao chão, de modo aleatório, o dado vai interromper seu movimento com alguma dessas faces voltada para cima, e um desses números estará visível com clareza. Dizemos que se trata de um dado honesto quando qualquer uma das faces do dado tem a mesma chance de aparecer voltada para cima como qualquer outra. O que significa ter a mesma chance?

Vamos pensar em termos de conjuntos (matematicamente falando). Intuitivamente, sabemos que o nosso experimento de jogar o dado terá como resultado quaisquer uma das faces numeradas de 1 a 6. A esse conjunto de todos os possíveis resultados do experimento vamos chamar de espaço amostral — indicado pelo símbolo \(\Omega \). Num experimento, é impossível que seu resultado esteja de fora desse conjunto, isto é, o espaço amostral representa o escopo do experimento. Matematicamente, vamos indicar que \(\Omega = \{1; 2; 3; 4; 5; 6\} \), ou seja, o espaço amostral é composto pelos números de 1 a 6, que são os possíveis resultados do experimento. Também matematicamente falando, representamos a quantidade de elementos de conjunto pelo símbolo \(\# \), de modo que ao escrever \(\#(\Omega) = 6 \), estamos dizendo que a quantidade de elementos do espaço amostral \(\Omega \) é 6.

Sabendo previamente desse conjunto dos resultados possíveis, um apostador decide tentar acertar o resultado previamente. O apostador só pode apostar em resultados que estejam dentro do escopo. Vamos supor que ele aposte que o resultado será um número par. Aqui temos um outro conceito importante: o conjunto dos resultados a serem avaliados — indicado pelo símbolo \(H \), que como o próprio nome sugere, consiste em resultados que, se ocorrerem, representam um sucesso da escolha feita previamente pelo apostador. Caso o resultado obtido não seja pertencente a esse conjunto, dizemos que houve insucesso ou falha. Desse modo, podemos representar a escolha do apostador como sendo \(H = \{2; 4; 6\} \), e como esse conjunto tem três elementos, também podemos escrever \(\#(H) = 3 \).

Intuitivamente, você já imagina que a probabilidade desse apostador ter sucesso é de 1 em 2. Por quê isso? Eis aí a primeira fórmula da probabilidade, definida como

\begin{split}
p(H) = {\#(H) \over \#(\Omega)}
\end{split}

que nada mais é do que a razão entre o número de elementos do conjunto dos resultados desejados e o número de resultados possíveis (o escopo). Lembre-se do que foi visto antes, tem-se \(\#(\Omega) = 6 \) e \(\#(H) = 3 \), de modo que quando fazemos a divisão da fórmula acima, obtemos

\begin{split}
p(H) = {\#(H) \over \#(\Omega)} = {3 \over 6} = {1 \over 2}
\end{split}

que é equivalente a dizer que a chance do apostador era de 1 em 2.

Observe o seguinte detalhe, que é muito importante: essa probabilidade foi calculada com base no espaço amostral, definido como escopo do experimento. Se o nosso escopo não fosse o espaço amostral (que é por definição o conjunto de todos os possíveis resultados), mas sim outro conjunto qualquer de resultados, digamos, o conjunto de números primos possíveis, então teríamos outra probabilidade. O que quero dizer com isso? Quero dizer que, se já soubéssemos que o dado desse como resultado apenas números primos, então isto seria o nosso escopo, e o resultado da probabilidade seria diferente.

Chamando de \(E \) ao conjunto de resultados primos do dado de seis faces, escreveríamos \(E = \{2; 3; 5\} \), e também que \(\#(E) = 3 \). Num caso como esse, em que a probabilidade não tem o espaço amostral como escopo, mas sim outro conjunto qualquer, então chamamos esse tipo de probabilidade de probabilidade condicional, dado que o experimento ocorre sob condições diferentes do padrão do espaço amostral. A fórmula da probabilidade condicional segue a mesma intuição da fórmula anterior, substituindo-se o espaço amostral \(\Omega \) por \(E \). Veja que a notação da probabilidade indica a condição sob a qual ela foi feita:

\begin{split}
p(H|E) = {\#(H) \over \#(E)}
\end{split}

Quando a probabilidade ocorrer com escopo no espaço amostral, basta escrever \(p(H) \); mas quando ela for condicional, é preciso escrever \(p(H|E) \). Mas a fórmula segue a mesma intuição de probabilidade.

No nosso novo exemplo, o dado só daria resultados primos, e o apostador continuou insistindo em números pares. O escopo deste exemplo é diferente, então é preciso recontar os resultados desejados dentro da condição estabelecida. Entre os números primos possíveis \(E = \{2; 3; 5\} \), o resultado par desejável se resume ao conjunto \(H = \{2\} \), de modo que \(\#(H) = 1 \). Então, a probabilidade desse apostador ter sucesso seria de

\begin{split}
p(H|E) = {\#(H) \over \#(E)} = {1 \over 3}
\end{split}

o que significa dizer que ele tem chance de 1 em 3 de acertar. Perceba a diferença para a probabilidade anterior. Antes a chance era de 1 em 2, agora é de 1 em 3 — ficou mais difícil para o apostador acertar o número na comparação com o escopo de antes (embora o novo escopo seja menor).

Em resumo, a mudança de escopo do problema de probabilidade num espaço amostral para um problema com condições diferentes faz dele um problema de probabilidade condicional, e isto poderá tanto aumentar a probabilidade como diminuí-la também, como no caso do último exemplo.

O que é o Teorema de Bayes?

O teorema de Bayes, escrito na sua forma simplificada, tem a seguinte forma:

\begin{split}
p(H|E) = {p(H) \times p(E|H) \over p(E)}
\end{split}

Vale uma explicação mais detalhada de cada um dos termos dessa fórmula, relembrando os conceitos já vistos até agora.

  • \(p(H|E) \): esta é a probabilidade de ocorrência do evento \(H \), condicionado a sabermos que \(E \) já aconteceu. No exemplo, seria o equivalente de calcular a probabilidade da ocorrência de um número par, já sabido que o resultado fosse um número primo (calculada anteriormente como 1 em 3).
  • \(p(H) \): probabilidade de ocorrência do evento \(H \), dentre todas as possibilidades do espaço amostral. No exemplo do texto, o evento \(H \) representava a ocorrência de um número par, no escopo padrão do espaço amostral (calculada anteriormente como 1 em 2).
  • \(p(E|H) \): esta é a probabilidade de ocorrência do evento \(E \), condicionado a sabermos que \(H \) já aconteceu. No exemplo, seria o equivalente de calcular a probabilidade da ocorrência de um número primo, já sabido que o resultado fosse um número par.
  • \(p(E) \): probabilidade de ocorrência do evento \(E \), dentre todas as possibilidades do espaço amostral. No exemplo do texto, o evento \(E \) representava a ocorrência de um número primo, no escopo padrão do espaço amostral.

Note a diferença entre \(p(H|E) \) e \(p(E|H) \). O primeiro, \(p(H|E) \), representa uma probabilidade de ocorrer número par dado que já se sabe que o resultado fosse um número primo; o segundo, \(p(E|H) \), representa a probabilidade de ocorrer número primo dado que já se sabe que o resultado seja um número par. São eventos completamente diferentes. No entanto, é disso o que se trata o teorema de Bayes: de relacionar probabilidades condicionais. Em probabilidade, é possível que uma dessas probabilidades condicionais seja muito díficil de avaliar pelos seus méritos próprios, de modo que o Teorema de Bayes simplificado facilite a avaliação através de outras probabilidades relacionadas aos eventos em questão.

Contudo, a fórmula acima — em especial o seu denominador — poderá ser reescrita numa forma mais completa, assim como descrita no livro Apologética Contemporânea do Dr. William Lane Craig:

\begin{split}
p(H|E) = {p(H) \times p(E|H) \over p(H) \times p(E|H) + p(\bar{H}) \times p(E|\bar{H})}
\end{split}

Note que o denominador desta fórmula é diferente. Contudo, são fórmulas equivalentes. É que esta fórmula traz mais detalhes para a avaliação da probabilidade. E que detalhes são esses? São detalhes referentes à possibilidade da não-ocorrência do evento condicionado — representadas matematicamente através dos termos \(p(\bar{H}) \) e \(p(E|\bar{H}) \) (atente para a barra acima da letra H, que simboliza a não-ocorrência do evento \(H \)). Isto tem implicações diretas para a avaliação de probabilidades de eventos históricos, condicionadas por certas hipóteses que tornam o evento em questão mais ou menos provável. É precisamente disto que trata o questionamento feito no Guia de Estudo, mencionado logo no início deste artigo.

Agora, dada essa longa explicação introdutória sobre probabilidade e o teorema de Bayes, vamos usá-los para avaliar hipóteses de interesse direto para a apologética cristã, a saber: (1) a hipótese de Jesus ter ressurreto dos mortos, dado que Deus exista; e (2) a hipótese de Jesus ter ressurreto dos mortos, dado que ele apareceu aos discípulos apos sua crucificação.

Usando o Teorema de Bayes

Vamos usar o teorema de Bayes simplificado para avaliar a primeira das hipóteses listada acima, a saber, de que Jesus tenha ressurreto dos mortos, na condição de que Deus exista.

Se entendermos o símbolo \(H \) como sendo o evento “Jesus ressuscitou” e o símbolo \(E \) como sendo a condicional “Deus existe”, então a probabilidade \(p(H|E) \) pode ser entendida como sendo a probabilidade de Jesus ressuscitar dada a condição de Deus existir, que é precisamente a hipótese que desejamos avaliar. Revendo o teorema de Bayes simplificado, teremos então

\begin{split}
p(H|E) = {p(H) \times p(E|H) \over p(E)}
\end{split}

As probabilidades \(p(E) \) e \(p(H) \) têm como escopo o espaço amostral, ou seja, devem ser avaliadas em seus próprios méritos, sem relação com quaisquer condições prévias. Sendo assim, entende-se que:

  • \(p(H) \) está no numerador da fórmula, e é a probabilidade de Jesus ter ressurreto, avaliada em seus próprios méritos. Numa avaliação de relance, parece ser uma probabilidade muito baixa, próxima do zero, considerando-se que não se tem relatos de pessoas terem sido ressurretas, além de contrariar a experiência universal de que uma vez morto, o corpo não volta à vida naturalmente.
  • \(p(E) \) está no denominador da fórmula, e é a probabilidade de Deus existir, avaliada em seus próprios méritos. Esta probabilidade dependerá muito da cosmovisão do avaliador, dada a natureza metafísica dessa probabilidade, e também da avaliação dos argumentos em favor da existência de Deus provenientes da Teologia Natural.
  • \(p(E|H) \) está no numerador da fórmula é a probabilidade de Deus existir, dada a condicional de Jesus ter ressurreto. Observe a importância dessa probabilidade: deve-se assumir como verdadeira a ressurreição de Jesus para daí então se avaliar a probabilidade de Deus existir. Talvez este seja o ponto mais desafiador para os avaliadores que pressupõem o ateísmo. Dito isso, é bastante plausível dizer que se víssemos alguém ressurgir dos mortos, então também perceberíamos a probabilidade de Deus existir como sendo muito alta.

Feitas essas considerações, agora passamos a avaliar o cálculo sugerido pelo Teorema de Bayes simplificado, de acordo com os valores que atribuímos às probabilidades mencionadas acima, e levando-se em consideração a cosmovisão do avaliador em \(p(E) \). Vamos avaliar o pior caso, que é a posição do ateu, que atribuiria um valor muito baixo para a probabilidade \(p(E) \) — a probabilidade de Deus existir. Este fator está no denominador da fórmula. Contudo, nós já assumimos que o fator \(p(H) \) no numerador da fórmula é também muito baixo, de modo que a probabilidade resultante da divisão apenas desses dois fatores ficasse próxima de 1 (um fator “anulou” o outro), restando ao ateu apenas a multiplicação pelo fator restante, \(p(E|H) \), que está no numerador da fórmula. Uma vez que já contabilizamos este fator como sendo de altíssima probabilidade, então a probabilidade resultante \(p(E|H) \) — a de Jesus ressuscitar, condicionada à existência de Deus — também acaba sendo alta.

A conclusão é que, mesmo para o ateu, a probabilidade de Jesus ressuscitar, considerando-se o contexto de sua vida e a existência de Deus, seria muito alta. Resta então ao ateu considerar as evidências para a existência de Deus a partir dos argumentos da Teologia Natural.

Na segunda parte deste texto, a ser publicada em breve, farei a avaliação da segunda hipótese mencionada acima, a saber, a de Jesus ser ressurreto dos mortos, dado que ele apareceu aos discípulos após sua crucificação segundo o teorema de Bayes completo.

Sobre Saulo Reis 40 Artigos
Diretor do Acrópole da Fé Cristã. Engenheiro de Computação por profissão; professor de Matemática por paixão; Teólogo por amor a Deus.

Seja o primeiro a comentar

Faça um comentário

Seu e-mail não será publicado.


*