Grupo - Dilema Do Prisioneiro

De Física Computacional
Revisão de 17h16min de 21 de janeiro de 2018 por Leonardoxr (discussão | contribs) (→‎Algoritmos)
Ir para navegação Ir para pesquisar

Integrantes do grupo: Leonardo Xavier Rodrigues (262696) e Rodrigo Lopes de Sousa Silva (262705)

Introdução

O dilema do prisioneiro junto com o dilema SnowDrift são problemas pertencentes a teoria dos jogos. Ambos funcionam de formas similares, baseando-se na interação entre duas pessoas(ou jogadores) e nas suas possíveis escolhas estratégicas para resolver seu problema. Esses dilemas são muito usados como metáforas para tentar explicar a evolução da cooperação através da seleção natural. O dilema do prisioneiro também poder ser usado para interpretar diversas outras formas de interação, desde biológicas até questões de economia.

Dilema Do Prisioneiro

O dilema do prisioneiro clássico é descrito como uma mini história:

Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para os condenar, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros, confessando, testemunhar contra o outro e esse outro permanecer em silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva 5 anos de cadeia. Cada prisioneiro faz a sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro. A questão que o dilema propõe é: o que vai acontecer? Como o prisioneiro vai reagir? Ref

Existem diversas versões deste dilema, variando os anos de prisão, mas todas com a mesma estrutura simples:

- dois jogadores

- duas ações possíveis

Nesta Wiki será utilizado uma versão com nomenclaturas diferentes:

Ambos os presos são apresentados com a possibilidade de cooperar(assumir o crime que ele e seu comparsa cometeram) ou Não assumir o crime. esse esquema pode ser visto visualmente com o auxilio de uma matriz chamada de matriz de ganhos

A, B Coopera Nega
Nega Ganho,Perda Perda, Perda
Coopera Ganho Menor, Ganho Menor Perda, Ganho

Onde ganho seria receber a liberdade imediata, perda a prisão por 10 anos e ganho menor a prisão por 5 anos. Neste esquema de jogo, o melhor a se fazer para beneficio mútuo seria cooperar, para que nenhum dos dois passe 10 anos na cadeia. Porém, não há como saber como o outro jogador irá responder ao jogo, Pois se você cooperar e seu comparsa negar o crime, você passará 10 anos na prisão e ele sai livre. Este problema é chamado também de jogo de soma não zero, onde não é possível unilateralmente mudar o resultado do jogo.


Dilema SnowDrift

Este dilema utiliza quase a mesma estrutura do anterior, porém com apenas alguns detalhes de diferença.

Nesta metáfora, duas pessoas estão em um carro preso em uma nevasca, cada uma delas tem a opção de sair do carro e com uma pá cavar a neve ao redor do carro ou simplesmente não fazer nada. nesta situação, diferentemente do dilema anterior, a melhor opção a se tomar quando o outro jogador se nega a colaborar ainda é colaborar, caso contrário você continuará preso na neve.

Tipos de população

As metáforas apresentadas acima são usadas para tentar explicar o aparecimento natural da cooperação através da seleção natural. Foram utilizados dois tipos de modelo de populações neste estudo.

O jogo é feito através da interação de um jogador com outro jogador, dependendo do algoritmo utilizado.

População misturada

Neste cenário a ideia é reproduzir um modelo de uma população na qual o jogador pode interagir com qualquer outro membro da população, um exemplo desse tipo de estrutura seria uma colonia de bactérias vivendo em um meio líquido, no qual elas podem se mover.

População Estruturada

Neste cenário o modelo simulado seria um no qual um membro da população pode apenas interagir com seus vizinhos próximos, na biologia uma placa de Petri(dish) com colonias de bactérias na superfície seria um bom exemplo desse modelo, já que nele as bactérias não podem se locomover.

Conceitos do jogo

Para implementar os dilemas em uma simulação e estudar seus resultados será analisado a matrix de ganhos para um jogador (p1) contra um segundo jogador (p2).

P1, P2 Nega Coopera
Nega P T
Coopera S R


P - Punishment

T - Temptation

S - Sucker's Payoff

R - Reward

Quando ambos Cooperam, o player um recebe a recompensa(Reward ), se ambos negam, o jogador 1 recebe punição(Punishment). Se o jogador um nega e o jogador 2 coopera, o primeiro receberá a tentação(Temptation), Caso contrário, o jogador um recebe Sucker's Payoff.

Algoritmos

Os jogos são feitos para estudar o comportamento de uma população e a sobrevivência da cooperação nela, para este fim é necessário dar valores a matriz de ganhos. Para cooperar existe um beneficio(b) e um custo(c), e a matriz de ganhos é baseada nesses valores.

Valores Para dilema do prisioneiro

R = b-c T = b S = -c P = 0


Valores Para dilema do prisioneiro

R = b-c/2 T = b-c S = -c P = 0

Resultados


Implementação em C

Link para Programas Usados[[1]]

Bibliografia

  • Dusan Misevic,Sebastian Bonhoeffer, Spatial cooperation games

https://www.ethz.ch/content/dam/ethz/special-interest/usys/ibz/theoreticalbiology/education/learningmaterials/701-1424-00L/scg.pdf

  • Game theory and physics, American Journal of Physics 73, 405 (2005)

http://dx.doi.org/10.1119/1.1848514

  • MARTIN A. NOWAK, SEBASTIAN BONHOEFFER, AND ROBERT M. MAY,Spatial games and the maintenance of cooperation

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC43892/pdf/pnas01133-0277.pdf

  • Behavioural evolution: Cooperate with thy neighbour?

https://www.nature.com/articles/428611a

  • Human cooperation in social dilemmas: comparing the Snowdrift game with the Prisoner's Dilemma

http://dx.doi.org/10.1098/rspb.2007.0793

  • Delação premiada e Teoria dos Jogos | Nerdologia 271

https://www.youtube.com/watch?v=EvjdS4vWdc8