Blog do Portera: TEORIA DOS JOGOS APLICADA À MANUTENÇÃO

TEORIA DOS JOGOS APLICADA À

MANUTENÇÃO

Um método estratégico aplicável para se alcançar a

cooperação entre os membros de uma equipe de

manutenção.

Anderson Faria

Técnico em Mecânica

Itaúna, janeiro de 2008

INTRODUÇÃO

O presente artigo pretende apontar soluções para os problemas de falta de cooperação de equipes, em especial a aquelas empenhadas em tarefas de manutenção. A Teoria dos Jogos vem sendo desenvolvida à muitos anos, mas foi com John von Neumann e Oskar Morgenstern que se evidenciou oficialmente como um ramo da matemática.

Posteriormente as teorias de John Forbes Nash contribuíram de forma absolutamente fundamental para a evolução da teoria e sua aplicação em todos os âmbitos da ciência, oficialmente os estudos referentes à Teoria dos Jogos, são hoje aplicadas em disciplinas como: Economia, Filosofia, Biologia, Psicologia, Física, Estratégia Militar, Ética, Neuro-Economia, além das Neurociências de uma forma geral. No entanto o campo a ser explorado é muito vasto, uma vez que toda e qualquer disciplina que envolve decisões e comportamento estratégico estão dentro do âmbito de estudo da Teoria dos Jogos.

Agora é a vez da Teoria dos Jogos decodificar comportamentos e apontar estratégias de

consolidação da cooperação das equipes de manutenção. De maneira a situarem aqueles ainda não familiarizados com a Teoria dos Jogos e a Teoria da Cooperação, trataremos abaixo de uma forma simplificada de cada um dos assuntos.

1.1 Equilíbr io de Nash

(FELICIANO, LÉA PAZ DA SILVA. Teoria dos Jogos:

Uma nova Proposta para o Ensino Médio, Mestrado

Profissional para o Ensino de Matemática, PUCSP São

Paulo, 2007)

O equilíbrio de Nash se refere à análise que cada jogador faz das melhores respostas que o outro

jogador dá às ações do primeiro. Nash definiu equilíbrio como uma situação em que nenhum jogador poderia melhorar sua posição escolhendo uma estratégia alternativa disponível, sem que isso implique que a melhor escolha feita particularmente por cada pessoa levará a um resultado ótimo. Ele provou que para uma determinada categoria muito ampla de jogos com qualquer número de jogadores, existe pelo menos um ponto de equilíbrio — desde que sejam permitidas estratégias mistas. Mas alguns jogos têm muitos pontos do equilíbrio e outros, aqueles relativamente raros que não se enquadram na categoria que ele definiu, talvez não tenham nenhum.

NASAR 2002, pi22

1.1.1 Dilema do Prisioneiro

Este jogo foi concebido em parte na Rand em 1950, alguns meses antes da chegada de John Nash. por Merrill Flood e Melvin Dresher. dois matemáticos da empresa. A história real dos prisioneiros usada para ilustrar a importância do jogo foi inventada pelo mentor de Nash em Princeton, Albert W. Tucker, que a usou para explicar do que se tratava a Teoria do Jogo para uma platéia de psicólogos de Stanfort.

(NASAR, 2002. p. 147)

O Dilema dos Prisioneiros foi inspirado pelo resultado do equilíbrio de Nash, conforme cita Silvia

Nasar. O Dilema dos Prisioneiros é a situação em que a polícia prende dois comparsas, João e Maria, por suspeitar que eles cometeram um crime grave, mas tem provas insuficientes para condená-los por este crime, mas pode deixá-los na prisão por um crime menor. Levados à delegacia e colocados em celas separadas. o promotor oferece a ambos o mesmo acordo; se um dos prisioneiros testemunhar para a procuradoria contra o outro e o outro permanecer calado, o traidor pega apenas dois anos de cadeia e o seu cúmplice, se não o trair, pega oito anos de cadeia.

Se ambos ficarem em silêncio, podem ser condenados somente a quatro anos de prisão cada um. Se ambos traírem o comparsa, cada um leva seis anos de prisão.

As decisões são simultâneas e um não sabe nada sobre a decisão do outro. O Dilema dos

Prisioneiros mostra que, em cada decisão, o prisioneiro pode satisfazer o seu próprio interesse (trair) ou atender ao interesse do grupo (cooperar). Apresentamos abaixo os possíveis resultados:

Tabela 3 Forma normal ou estratégica

É importante salientar que as decisões de ambos são estritamente racionais. não havendo nenhuma interferência de ordem afetiva, moral ou religiosa. Assim, podemos fazer as considerações (lógico matemáticas) que cada prisioneiro faz sobre sua situação.

Em primeiro lugar, a opção mais interessante parece ser a cooperação recíproca. Maria e João não confessam, pegando cada um deles quatro anos de prisão, mas...

Mas se eu sou a Maria e penso que o João não vai confessar, eu me saio melhor confessando (traindo), minha confissão (trair o João), aconteceria simultaneamente à cooperação de João (não confessa), resultando um melhor pagamento para mim. Da mesma forma...

Se eu me coloco no lugar de João e penso que é a Maria quem não vai confessar (não trai), eu, João confesso e pego somente dois anos de prisão, ao passo que Maria pega oito anos de prisão. Mas também...

Se eu (Maria ou João) penso o oposto e acredito que o outro vai confessar, eu não posso ficar calado (não confessar). pois, assim, eu é que vou ficar oito anos na prisão, enquanto o outro fica apenas dois.

Von Neumann e Morgenstern propuseram um modelo matemático interativo, que os levariam a descrição acima. Mas Nash resolveu este problema propondo: Se eu (Maria ou João) achar que meu cúmplice pensa exatamente como eu, concluo que ele vai confessar, o que me leva a um impasse. Na prática. eu só posso confessar! E é efetivamente o que acontece, ambos confessam e passam seis anos presos. A isso, chama-se equilíbrio de Nash : a

melhor decisão possível levando-se em conta a decisão que o outro deve tomar.

A questão que o dilema propõe é: o que vai acontecer? Como o prisioneiro vai reagir? Os prisioneiros confiarão no seu cúmplice e negarão o crime, mesmo correndo o risco de serem colocados numa situação ainda pior, ou confessarão . apesar de que, se o outro fizer o mesmo, ambos ficarão numa situação pior do que se permanecessem calados?

Nesse jogo, não importa os valores das penas, mas o cálculo das vantagens de uma decisão cujas

conseqüências estão atreladas às decisões de outros agentes, em que confiança e traição fazem parte da estratégia do jogo. No jogo, quando cada pessoa persegue seu próprio interesse particular, ela não promove, necessariamente, o melhor interesse da coletividade (NASAR. 2002 p. 148).

A teoria de Nash previa que os dois jogadores escolhessem suas estratégias dominantes, embora obtivessem um resultado melhor se escolhessem as estratégias dominadas.

De nada adianta um dos prisioneiros prometer ficar calado se o outro também ficar, pois sua estratégia estritamente dominante está na deserção. Apenas quando rodadas sucessivas do Dilema dos Prisioneiros são permitidas é que a comunicação poderia servir para alinhar os interesses contrários em torno da cooperação mútua, mas isso envolve outros fatores típicos da iteração do jogo. No Dilema dos Prisioneiros, a comunicação pode ajudar no aparecimento da cooperação, sem a necessidade de firmar acordos, apenas pela implementação de ações de reciprocidade.

A previsão da Teoria dos Jogos e do equilíbrio de Nash era que jogadores racionais egoístas optassem sempre por uma estratégia dominante quando esta existisse, independente do que o outro fizesse. No Dilema dos Prisioneiros, as duas partes possuem estratégias desse tipo e o resultado esperado é a deserção mútua e a punição com a condenação dos dois presos pelo crime mais grave, ao invés de uma pena leve relativa ao delito pelo qual foram capturados. A partir da interface policial montada por Albert Tucker, logo se compreendeu que o Dilema dos Prisioneiros poderia ser a estrutura simplificada de uma série de interações entre pessoas, empresas e até mesmo nações, em larga escala.

1.2 Evolução da Teor ia da Cooper ação

SILVA, ANTÔNIO ROGÉRIO DA. Teoria dos

Jogos e da Cooperação para Filósofos

Em 1984, Robert Axelrod apresentou, no livro The Evolution of Cooperation, uma descrição da maneira pela qual o Dilema dos Prisioneiros Iterado, repetido por várias rodadas, pode privilegiar a escolha da cooperação, mesmo em seres irracionais tão simples como bactérias e, aparentemente, sem nenhum aparato linguístico. O projeto começou tentando responder a questão sobre quando as pessoas cooperam ou são egoístas umas com as outras nas interações entre elas. O Dilema dos Prisioneiros parecia então ser um modelo que representava adequadamente tal possibilidade de interação. Para explorar em detalhes o comportamento estratégico que poderia ser adotado aí, teóricos ou especialistas de cinco disciplinas afins matemática, economia, ciência política, sociologia e psicologia foram convidados a participar de um torneio de computador, programado para executar o Dilema dos Prisioneiros. Ao lado de uma regra randômica que colabora ou deserta metade das vezes , foram submetidas ao teste virtual 14 estratégias diferentes elaboradas por esses especialistas.

A estratégia vencedora foi TIT FOR TAT (OLHO POR OLHO OPO, ou o literal ISTO POR AQUILO, também traduzida como PAGAR NA MESMA MOEDA), um comando simples que começava o jogo cooperando com o adversário e repetindo depois a mesma ação que o outro jogador tivesse feito no movimento anterior. Após o conhecimento desse resultado, Axelrod propôs um novo torneio ampliando a participação a todos os interessados, incluindo professores de biologia, física, ciência da computação e fanáticos por jogos eletrônicos. Especialistas de seis países

participaram do segundo campeonato, apresentando 62 programas diferentes que disputavam com

RANDÔMICA em cinco rodadas, cuja média de movimentos era de 151 lances, pois o jogo dessa

vez não tinha um limite determinado para seu encerramento, que no máximo chegava a 308 movimentos. Mais uma vez, OLHO POR OLHO venceu a competição.

O sucesso de OPO provocou o desdobramento da pesquisa para um cenário evolutivo, onde se procurou interpretar a execução das estratégias em contextos não cooperativos, com diversos tipos de rivais empregando suas respectivas linhas de ação, sendo que a melhor destas deveria ser resistente a invasões em seu território. Das estratégias apresentadas, OPO mostrou-se passível de ser adotada por aqueles minúsculos organismos por causa de sua simplicidade e clareza. Mostrou-se também vitoriosa na maioria das circunstâncias e no enfrentamento da maior parte das estratégias concorrentes, privilegiando a formação do equilíbrio de Nash [1].

Os motivos para a tendência cooperadora prevalecer num ambiente de pura competição, como é a natureza, devemse a certas condições circunstanciais que contribuem para o êxito de OPO. A proximidade entre indivíduos, ainda que egoístas, e as interações repetidas permitem que a reciprocidade das ações surja num segundo momento, desde que os organismos sejam dotados com aparelhos capazes de fazerem a marcação, rotulagem, e o posterior reconhecimento desses rótulos. Assim, é possível discriminar no instante seguinte aqueles que antes cooperaram ou não. A reunião de indivíduos em grupos de cooperadores/retaliadores proporciona a formação de uma vizinhança resistente a invasões de oportunistas/exploradores. Fenômeno tão próximo de cada um que mal é percebido: o sistema imunológico composto por células que rotulam, identificam e atacam os vírus e bactérias que a todo o momento invadem os corpos dos seres vivos [2]. OPO evita conflitos desnecessários, enquanto todos agem de modo recíproco, respondendo de imediato às deserções não motivadas, mas logo esquecendo as provocações passadas após o retorno à cooperação. A transparência das intenções e, por conseguinte, a facilidade de identificação do padrão de conduta dos agentes estimula o cumprimento dos “compromissos” assumidos, assim, tacitamente, através de um consenso implícito [3].

A facilidade do reconhecimento e a simplicidade de execução de estratégias recíprocas, com característica de gentileza (nice), retaliação, clemência (forgiving) e clareza, fazem de

comportamentos como os prescritos pela estratégia OPO uma linha de ação robusta, estável e viável em circunstâncias onde a comunicação atua na sua forma mais rudimentar, na transferência de informações mínimas (bytes). Basta apenas que os agentes sejam capazes de reconhecer em contatos repetitivos as ações amigáveis ou não e responder adequadamente cooperando ou desertando daqueles que no passado imediato foram rotulados como cooperadores ou desertores. A consolidação desse comportamento com o tempo acaba por gerar um processo de “aprendizagem” que nos seres irracionais se dá com o sucesso evolutivo da proliferação em gerações futuras dos genes “retaliadores”, aqueles que “sabem” aplicar OPO e, por conta disso, sobreviveram em maior número de indivíduos.

Importante notar que os arranjos dos torneios originais que propiciaram a vitória de OPO permitiam somente lances em que cooperar (C) e desertar (D) eram escolhidas em estratégias puras, deterministas, isto é, sem variação da probabilidade que promovesse estratégias mistas. Axelrod delineou os confrontos deixando de lado a ocorrência de erros ou ruídos na escolha entre C e D. Supôs também que era indiferente as rodadas serem executadas de maneira simultânea ou alternada. De todo modo, a comunicação anterior aos lances estava vedada, sendo cada movimento realizado silenciosamente. Os jogadores tomavam conhecimento das escolhas de seus oponentes imediatamente após elas terem sido feitas.

A Teoria da Cooperação proposta por Axelrod baseouse, então, na investigação de como

indivíduos que visam satisfazem seus próprios interesses podem cooperar entre si, sem ajuda de uma autoridade central que os forçassem a isto [4]. A tradição moderna tem no contrato social sua resposta ao modo como a cooperação poderia emergir. No entanto, o contratualismo precisa que haja um terceiro elemento entre as partes ao qual se possa recorrer, a fim de que os acordos sejam mantidos por todos envolvidos. Porém, há circunstâncias onde, apesar de não existir uma entidade que possa mediar e resolver as divergências, a cooperação deve surgir sob pena de todos terem de arcar com os prejuízos de uma competição generalizada.

Assim, o comércio internacional tem de solucionar seus problemas segurança, tarifas e pirataria com o emprego de estratégias adequadas que não exijam o apoio de elementos externos às relações entre as partes concernidas. Em meio a um poder político autônomo, como o parlamento em sociedades democráticas, o conflito de interesses deve ser resolvido pelos membros de cada setor sem a interferência de um outro poder constituído executivo ou judiciário, por exemplo. Nesses e em outros casos, é necessário que os agentes cooperem sob pena de obterem os piores resultados possíveis.

Dessa forma, o Dilema dos Prisioneiros veio a calhar como modelo de jogo que representava a situação em que o uso de estratégias dominantes pelas partes, ao satisfazerem seus próprios interesses, resultassem em um ganho baixo a todos os jogadores. Ademais, a estrutura do jogo não permitiria que nenhum mecanismo de ameaça ou promessa estivesse disponível. A informação imperfeita também impedia que um jogador soubesse o que o outro viesse a fazer na sua vez de jogar. Todos participantes seriam hábeis para realizarem suas estratégias e não haveria como alterar os valores obtidos com pagamentos laterais (propinas), mudando também a função de utilidade do outro.

Com a repetição da interação entre os agentes, foi possível notar os efeitos que a sombra do futuro pôde exercer sobre o comportamento dos mesmos. À medida que o jogo avança, a confiança entre as partes aumentava na mesma proporção em que a desconfiança, quando o final do jogo se aproximava. Tornar o final da partida indeterminado favoreceu a manutenção do comportamento cooperativo. Quanto maior fosse a distância a ser percorrida no futuro, tanto maior a dependência da escolha das estratégias, segundo a conduta adotada pelo outro. Uma estratégia de "retaliação permanente" cooperar até que o outro deserte, então sempre desertando em seguida , por exemplo, poderia ser facilmente explorada por alguém que conhecesse o prazo do término do jogo, sendo tentado a não cooperar nas últimas movimentações. Porém, esse estímulo não haveria se a data final fosse incerta e a expectativa de uma longa punição até o término da partida fosse grande.

Outro fator que preponderou na escolha do Dilema dos Prisioneiros como matriz básica da teoria da cooperação foi o fato de sua estrutura ser tão simples que, a rigor, não era essencial que os participantes fossem racionais ou tivessem consciência das escolhas que estavam fazendo. Nem sequer precisariam tentar maximizar suas recompensas, bastando apenas que fossem capazes de aplicar um padrão de comportamento, procedimentos, hábitos, instintos ou imitação como faz a maioria dos seres vivos. Nesse sentido, as ações implementadas podem ser executadas sem que o processo deliberativo seja compreendido pelo agente. Assim, no âmbito mais amplo, a teoria da cooperação poderia envolver pessoas, firmas, nações ou bactérias, em uma teoria geral dos jogos evolutivos, nos quais as estratégias vitoriosas são passadas às gerações futuras pelo sucesso de um programa genético, ou não, que determine as ações dos indivíduos [5].

Apoiada fortemente na reciprocidade, a teoria da cooperação de Axelrod chamou atenção para a importância do conceito de evolução na escolha de um equilíbrio dentre infinitas possibilidades existentes em jogos repetidos várias vezes. Aqueles aspectos cujos fatores ajudaram também a compreender melhor o papel da comunicação nesse processo evolutivo.

1.3 Condições para Cooperação

SILVA, ANTÔNIO ROGÉRIO DA. Teoria dos

Jogos E da Cooperação para Filósofos

Os diversos experimentos realizados em torno do Dilema dos Prisioneiros Iterado, todas simulações e torneios de computador, bem como as estratégias construídas para enfrentar as peculiaridades de cada situação subsidiaram a discussão sobre as condições e os pressupostos que promovem o comportamento cooperativo entre os jogadores. Compreender quais são os fatores que contribuem para formação e manutenção da cooperação é uma das metas principais da filosofia política, da ética, e da psicologia comportamental. Uma sociedade bem ordenada só pode se manter como tal se houver a cooperação entre seus membros. Cooperar com o outro é um aspecto do altruísmo que pode ser explicado, mesmo entre agentes egoístas, sem perda de consistência, por conta dos efeitos da reciprocidade exigida pelas partes e que fundamenta princípios éticos fortes como a conhecida Regra de Ouro faça ao outro aquilo que gostaria que fizesse a si mesmo.

O livro The Evolution of Cooperation, de Robert Axefrod, é o responsável pelo lançamento dessa Teoria da Cooperação que procura responder à simples questão de como agentes egoístas podem seguir cooperando uns com os outros, sem a necessidade de nenhum instrumento externo como o Estado, instituições jurídicas ou contratos que obriguem a levar em consideração os interesses dos outros. De um ponto de vista radical, nem mesmo uma racionalidade forte seria requerida para que a cooperação emergisse e, por conseguinte, até mesmo organismos muito simples, bactérias, vírus etc, poderiam ser considerados aptos a tomar parte da interação igualmente fácil de se perceber como o Dilema dos Prisioneiros.

Por conta de sua montagem simplificada, biólogos, políticos, economistas e matemáticos puderam propor uma ampla gama de cenários onde os agentes poderiam atuar. A concepção de agente utilizada partilha da noção de agência creditada do filósofo estadunidense Daniel Clement Dennett. Um agente dennettiano tem capacidade suficiente para praticar ações, ao invés de apenas sofrê-las. Este agente atua em função de razões ou conjunto de instruções sobre as quais não tem consciência [6].

Fora da filosofia, um agente dennettiano corresponde a sistemas complexos dinâmicos, às

macromoléculas orgânicas e aos autônomos celulares. Organismo que reagem entre si segundo regras, leis da física ou químicas e programas instalados. Assim sendo, a reprodução do comportamento de unidades reativas tão básicas pôde ser perpetrada convenientemente em torneios virtuais de computadores. As simulações que se sucederam às primeiras competições promovidas por Axelrod trataram de explorar as consequências e conclusões anunciadas em 1984.

Em seu livro, Axelrod apresentou as condições que considerava responsáveis pela vitória da estratégia OLHO POR OLHO entre as cooperadoras. A ação de OPO era clara, gentil, retaliadora e clemente. Essas quatro primeiras condições eram tidas, então, como sendo a chave explicativa para a robustez exibida nas disputas iniciais [7].

Com base nessas propriedades, alguns conselhos foram proferidos como sendo adequados para jogadores desenvolverem sua finalidade em uma longa interação do tipo do Dilema dos Prisioneiros: não ser o primeiro a desertar, não ser invejoso, nem ardiloso e responder com reciprocidade à cooperação e a deserção [8]. A ambição de um ganho maior sobre o outro jogador eventualmente conduz a uma tentativa de reparar o desequilíbrio dos resultados. Isto leva, então, a uma deserção que visa retificar as perdas sofridas. Dessa forma, jogadores invejosos provocariam a ruína mútua através de uma série de punições repetidas. Por ser uma estratégia que nunca busca vantagem sobre os ganhos dos outros, OPO consegue no máximo igualar os ganhos aos do outro jogador ou um pouco abaixo do outro. Mesmo assim, no ambiente dos dois primeiros torneios, foi a estratégia que obteve a melhor pontuação média em comparação às demais.

Os ganhos equilibrados de um jogador OPO, ocorreu por que este nunca é o primeiro a desertar. A gentileza inicial evitava a deflagração de conflitos desnecessários. Estratégias gentis, não por acaso estiveram entre as melhores colocadas, não obstante o fato da deserção ser uma estratégia dominante na versão básica do Dilema dos Prisioneiros, em uma só rodada. A falta de gentileza pode trazer vantagens imediatas, mas a longo prazo degrada a convivência necessária para sua proliferação ao futuro, como ocorreu a todas estratégias desse tipo na disputa ecológica feita depois do segundo torneio [9].

Muita sofisticação e sutilezas dos programas não foram características próprias aos algorítmos que tiveram êxito no DPI. Comportamentos ardilosos e muito complexos podem, dada a dificuldade de compreensão pela outra parte, ser considerados aleatórios, imponderáveis, ou irresponsáveis. Desta forma, estratégias difíceis de entender são perigosas devido à falta de clareza sobre suas ações o que gera desconfiança em quem deve participar da cooperação. A clareza de OPO foi uma das razões para seu desempenho vitorioso. Ao contrário do jogo de soma zero, onde ocultar informações sobre sua linha de ação dificulta as tomadas de decisões do adversário a ser derrotado, em jogos de soma variável, como o DPI, em que se busca a cooperação do outro, é importante parecer transparente, sinalizando e fornecendo garantias de que o objetivo de ambos maximizarem seus resultados passa pela cooperação mútua. Tal transparência das ações é reforçada à medida que a cooperação for sendo retribuída com cooperação e deserção punida com deserção. De todos os conselhos extraídos dessa forma de interação, a prática da reciprocidade é o mais eficaz, de um modo geral.

1.3.1 Objeções e Respostas

Como sempre ocorre em debates filosóficos, esses conselhos e as propriedades relacionadas às estratégias vitoriosas nas simulações e intuitivamente aceitáveis foram criticados por outros pesquisadores que não estavam satisfeitos com as conclusões tiradas. Kenneth Binmore atacou duramente as propriedades atribuídas a OPO, advertindo que, em contextos específicos, estratégias que não fossem claras, gentis, retaliadoras e clementes poderiam também ser bem sucedidas [10].

Além deste, vários outros pesquisadores consideraram irrealista as primeiras simulações e

introduziram novos ingredientes, a fim de aproximar aquelas descrições ao ambiente natural cotidiano. Alternância de movimentos, possibilidade de erro ou má compreensão, memória de mais de uma rodada, ao lado de diversos outros aspectos ligados à topologia do território foram criados para tornar ainda mais precisas as observações feitas sobre a interação entre os organismos.

De um modo geral, todas as dificuldades postas acabaram por confirmar os resultados iniciais que apontavam para a possibilidade da cooperação evoluir na maioria das circunstâncias examinadas. Contudo, de acordo com a avaliação de Robert Hoffmann feita duas décadas depois de constantes debates aos torneios iniciais, outras estratégias, que não a OPO determinista, poderiam promover a cooperação sob certas condições. Toda uma família de estratégias variantes de OPO foi gerada. Outros algoritmos híbridos permitiram a ligação entre famílias concorrentes, diluindo as fronteiras entre estratégias cooperadoras.

Os resultados dessa literatura, portanto, confirma um número de descobertas chaves dos trabalhos teóricos. Primeiro, a cooperação é possível em equilíbrio quando jogadores não levam em consideração o término do jogo. Segundo, na estrutura evolucionária, qualquer estratégia que propague rigidez pode ser em última instância deslocada por formas alternativas de comportamento
(HOFFMANN, R. “Twenty Y ears On “, § 4.2, p. 10).

De todos o s atributos estratégicos e condições necessárias para a cooperação, a reciprocidade surge como elemento principal. Contudo, outros fatores relevantes ajudam a entender porque acooperação nem sempre ocorre entre espécies diferentes e como ela pode ser mantida em meio à adversidade. Relacionamentos mais complexos em cenários que envolvam eventos aleatórios, mudanças territoriais, erros, alternância etc, mostraram a necessidade de manutenção de um contrato estável ou de uma larga “sombra do futuro”, no intuito de permitir a previsão do comportamento do outro a partir de uma adaptação a longo prazo, com obtenção de resultados favoráveis o bastante para que a deserção não viesse a ser compensada.

[A] utilização e extensão do paradigma original do Dilema dos Prisioneiros iterado entre duas pessoas previu de ricas possibilidades os efeitos de uma ampla faixa de fatores tais como o tempo dos movimentos tomada de garantias, redes sociais, adaptação, inveja, ruído e mobilidade. A luz de extensa literatura existente, sobre os modelos relatados relacionam resultados dos modelos detalhadamente relatados sobre cada fator, bem como para a contínua adoção de novos temas (AXELROD, R. “On Six Advances in Cooperation Theory”, pp. 31/32).

A simplicidade dos modelos empregados nas simulações realizadas delinearam como a cooperação entre organismos complexos pode emergir no ambiente biológico natural, a partir do permanente incentivo a repetida interação entre indivíduos. O reconhecimento e as lembranças das ações passadas de cada um estimulavam os seres inteligentes a manter a cooperação entre os cooperadores e a deserção para os que têm má reputação de desertores. Nos casos de agentes mais simples, próximos aos autômatos celulares, a cooperação resiste em face da reação da vizinhança.

Direta ou indiretamente, a reciprocidade é, portanto, uma condição necessária para sustentação a cooperação. Mas essa não é a única maneira disso acontecer. Sem a memória ou qualquer recordação das ações passadas, a reciprocidade deixa de ser um fator efetivo. Nesses casos, apenas a similaridade, ou o recurso ao reconhecimento de uma marca ou etiqueta que identifique um parceiro semelhante ao seu algoritmo. seria capaz de fazer prevalecer a tolerância ou a cooperação entre os agentes. No entanto, a proliferação das etiquetas ou mesmo a falsificação delas podem gerar equívocos custosos àqueles que só cooperam pela observação de sinais externos. Entretanto, essas características fisionômicas ou comportamentais poderiam explicar a aplicação de mecanismos etnocêntricos, como forma de garantir a cooperação entre os membros de um grupo identificado pelos mesmos rótulos [11].

Na prática, a similaridade pode explicar o florescimento da cooperação entre espécies ou etnias. Porém, embora à primeira vista possa parecer uma forma simples e econômica de encontrar parceiros bons cooperadores, as etiquetas implicam em um custo crescente no refinamento do aparato de identificação, a fim de evitar falsificações e o oportunismo dos organismos que mimetizam as maneiras do outro se apresentar ou comportar. Recorrer a garantias, por vezes acaba em regressão ao infinito de um inferno burocrático em torno do aval das garantias, fiadores, garantias dos fiadores etc.

Se as sinalizações por meio de etiquetas podem enfrentar problemas de identificação ao longo do tempo, a reciprocidade obriga que os jogadores estejam atentos para as ações executadas pelos outros. Mais do que as palavras, importa aos agentes recíprocos os resultados obtidos da interação.

Em todo caso, as recomendações não são tão simples quanto possam parecer as regras adotadas. Intuitivamente, permanecem válidos os conselhos de Marco Polo a Kublai Khan em Cidades Invisíveis. de Italo Calvino.

O inferno dos vivos não é algo que será; se existe, é aquele que já está aqui, o inferno ao qual vivemos todos os dias, que formamos estando juntos. Existem duas maneiras de não sofrer. A primeira é fácil para a maioria das pessoas: aceitar o inferno e tornar-se parte deste até o ponto de deixar de percebê-lo. A segunda é arriscada e exige atenção e aprendizagem contínuas: tentar saber reconhecer quem e o que, no meio do inferno, não é inferno, e preservá-lo e abrir espaço (CALVINO, I. As Cidades Invisíveis, 9, p. 150)

O DPI apresenta alguns aspectos básicos relacionados com a emersão da cooperação entre agentes egoístas em interação direta, uns com os outros. Evolutivamente, espécies de primatas, além do Homo sapiens, comportam-se como altruístas recíprocos que consolidaram estratégias em situações semelhantes ao dilema dos prisioneiros. Sem embargo, convém notar que o DPI é adequado para análise do comportamento entre duas partes. Para mais de dois jogadores, outros modelos esclarecem pontos que não são precisamente detectados em simulações baseadas em jogos bimatriciais (2 X 2). Os Bens Públicos vêm esclarecer outros aspectos da cooperação em dilemas sociais [12].

DESENVOLVIMENTO

Os experimentos citados na Introdução deste trabalho provam como se tornar possível a cooperação entre os membros de uma equipe de forma totalmente natural. O desafio agora é desenvolver um modelo estratégico que permita aos membros de toda equipe a identificar, e reconhecer os cooperadores e os desertores dentro da equipe, de forma que com o passar do tempo, cooperação mútua entre todos os membros seja firmada.

O Objetivo das equipes de manutenção é garantir a disponibilidade dos equipamentos. Para que isso seja possível é indispensável que haja cooperação entre os membros da equipe. Porém cooperação não se consegue gratuitamente, o indivíduo coopera com alguém se alguém coopera com o indivíduo. É natural também que haja desertores, indivíduos que para garantir seu próprio ganho são capazes de “trair” os objetivos da equipe.

EXEMPLOS:

Um indivíduo que fazendo a manutenção de um equipamento em campo, no caso um redutor permite, contra sua vontade que elementos contaminantes, poeira, areia, minério, estopa, enfim qualquer coisa que possa aumentar o desgaste dos elementos internos do mesmo, não fizesse a limpeza e manutenção adequada para impedir que tal contaminante interfira no funcionamento do equipamento. Isto com é de se esperar reduz drasticamente a disponibilidade e a confiabilidade de um equipamento.
Um lubrificador que necessitando da bomba de óleo para a lubrificação de um determinado equipamento, não retira o óleo de especificação diferente, nem limpa cuidadosamente a mesma, permitindo a contaminação do novo lubrificante pelo que estava antes na bomba. Um lubrificante contém além de óleo mineral (na maioria dos casos), vários compostos químicos aditivos que podem reagir entre si se misturados de forma aleatória, tornando o óleo inadequado para lubrificação. Isto também reduz drasticamente a confiabilidade do equipamento.
Um inspetor que tendo observado um defeito omite este de seu relatório por considerá-lo insignificante. Defeitos, mesmo aparentemente insignificantes, podem identificar uma falha de grande extensão. Omissão em serviços de inspeção são casos graves de deserção que reduzem de forma perigosa a disponibilidade e confiabilidade de equipamentos.

O melhor meio de se evitar que desertores se proliferem numa equipe é identificandoos. Pois uma vez que um desertor é identificado como tal através da informação aos outros membros, após a retaliação, que no caso seria a exposição de sua falha, seja esta intencional ou não, este mesmo desertor, por razões egoístas, voltará a cooperar novamente com a equipe devido ao temor de nova retaliação.

Da mesma forma o melhor meio de se conservar cooperadores é identificandoos. O cooperador assim como o desertor se move por atitudes igualmente egoístas se esforçará para se manter como um cooperador, uma vez que os resultados divulgados sobre sim, o identificarão de forma altamente positiva entre os membros da equipe.

Antes de proceder ao processo de identificação, é importante classificar os equipamentos por necessidades técnicas, e classificar os mantenedores por capacidade técnica e, dentro de uma distribuição tão uniforme quanto possível, dividir a responsabilidade dos profissionais pelos equipamentos. Esta classificação e divisão se tornam necessárias, para evitar que um ajustador mecânico, por exemplo, se veja diante de um problema de disponibilidade de um equipamento eletro-hidráulico, sem ter as condições técnicas adequadas para resolvê-la.

O processo de identificação é em si bem simples, funcionando dentro dos quadros de avisos e dos

identificadores de qualidade. O ideal seria identificar os equipamentos considerados confiáveis com seu Índice de Disponibilidade [13] exibindo os indivíduos responsáveis diretamente pelos resultados apresentados. Em contrapartida, serão disponibilizados também os dados dos equipamentos problemáticos, detalhando-se as falhas em especial no que se refere à causa do rompimento prematuro. No caso de a planta já dispor de um sistema baseado em modelos matemáticos de progressão de falha, seria interessante que os que se mostrassem fora do padrão do modelo também tivessem seus dados expostos. Problemas crônicos também devem ser apontados como tal, e toda a ação feita para resolução deste publicada, afim de que toda equipe se intere da evolução do problema e da solução do mesmo, também neste caso os responsáveis diretos pela evolução e correção do problema deverão ser divulgados.

As informações sobre os equipamentos expostos desta forma farão com que os indivíduos mais cooperativos, empreendedores e ousados, ajam de forma voluntária para a resolução dos problemas, chegando a casos em que se ofereçam para serem responsáveis pelo equipamento problemático, não por altruísmo, mas por egoísmo, por desejo de mostrar que está entre os melhores.

O mais interessante de tudo é que os agentes em questão sequer precisam saber que estão sendo levados a agirem de forma cooperativa, por que a sua cooperação nada tem a ver com altruísmo, mas com egoísmo. Em casos de desertores crônicos, estes podem ser colocados em companhia de indivíduos mais cooperativos, isto aumentará a sua sensibilidade à retaliação, além de que seus atos serão ininterruptamente vigiados pelos seus companheiros cooperadores.

CONCLUSÃO

Mais uma vez a Teoria dos Jogos se mostra útil na resolução de problemas polêmicos, onde o comportamento humano se torna determinante em problemas aparentemente desconectados à matemática.

É mais fácil uma equipe altamente cooperativa equipada com recursos metodológicos adequados para resolução de problemas alcançar a excelência na disponibilidade de equipamentos, do que uma equipe de membros isolados no cumprimento de suas obrigações apenas pelo seu salário e a possibilidade de uma promoção.

Este método baseado em experiências anteriores em varias áreas não necessita de investimentos altos, mas tão somente imaginação para a sua aplicação. E uma vez este método aplicado os resultados serão rápidos e fáceis de se observar, pois a equipe motivada pelos seus próprios resultados, se tornará uma equipe extremamente dinâmica como nunca fora antes.

REFERÊNCIAS BIBLIOGRÁFICAS

Antônio Rogério da Silva. “Teor ia dos Jogos e da Cooper ação para Filósofos”.

Léa Paz da Silva Feliciano. “Teor ia dos Jogos: Uma nova Proposta par a o Ensino Médio”,

Mestrado Profissional para o Ensino de Matemática, PUCSP São Paulo, 2007.

Pedro Aladar Tonelli, “Um Minicurso em Teor ia dos Jogos”.

Harold W. Kuhn, John C. Harsanyi, Reinhard Selten, Jörgen W. Weibull, Eric Van Damme, John F. Nash, Jr, Peter Hammerstein, “The Work of John Nash In Game Theory” Nobel Seminar,

December 8, 1994.

Anderson Faria. “Engenhar ia de Manutenção e Manutenção Condicional”, Itaúna, MG –

SOMISA – Grupo J. Mendes, 2006.

1 Veja AXELROD, R. The Evolution of Cooperation, cap. 5, pp. 88105.

2 Veja BANCHEREAU, J. “O Longo Braço do Sistema Imunológico”, p. 69.

3 Veja AXELROD, R. Op. cit., cap. 1, pp. 2021.

4 Veja AXELROD, R. Idem, part. I, cap. 1, p. 6.

5 Veja AXELROD, R. Ibidem, part. I, cap, 1, pp. 17 a 19.

6 Veja DENNETT, D. CI. Tipos de Mentes, cap. 2, p. 26.

7 Veja AXELROD, R. The Evolution of Cooperation, cap. 2, p. 54.

8 Veja AXELROD, R. Op. cii., cap. 6, p. 110.

9 Veja AXELROD, R. Idem, cap. 6, p. 117.

10 Um sumário dessas críticas encontra-se em BINMORE, K. “Review: The Complexity of Cooperarion “, resenha de 1998.

11 Veja RIOLO, R. L., COHEN. M. D. & AXELROD, R. “Evolution of Cooperation without Reciprocity” e

AXELROD, R. & HAMMOND, R. A. “The Evolution of Ethnocentric Behavior” para o assunto das etiquetas.

12 No caso de Teoria dos Jogos aplicada à Manutenção, o modelo bimatricial é adequado por se tratar de uma interação entre o indivíduo e a sua equipe. Portanto Os Bens Públicos não será citado.

13 Índice de Disponibilidade – é dado por Disponibilidade = (tempo médio entre falhas x 100)/(tempo médio entre falhas + tempo médio para reparo)

sábado, 29 de outubro de 2011

TEORIA DOS JOGOS APLICADA À MANUTENÇÃO

Nenhum comentário:

Postar um comentário