본문 바로가기
미시경제

팃포탯(Tit-for-Tat) 게임 이론 - 2편

by poporim 2024. 1. 13.
반응형

팃포탯의 시뮬레이션 대회

팃포탯 전략은 상대방과의 무조건적인 협력을 전제로 시작한다. 그 이후에는 상대방의 배신에는 보복으로 대응한다. 그리고 상대방이 재차 협조를 요청하면 다시 관용적인 용서와 적극적인 협조로 돌아서는 전략이다.

 

앞서 설명했던 팃포탯 전략의 1편에 이어 설명하겠다. 1차 게임에는 총 14개 팀이 참여했는데, 팃포탯 전략이 우승을 차지했었다. 

2024.01.12 - [미시경제] - 팃포탯(Tit-for-Tat) 게임 이론 - 1편

 

팃포탯(Tit-for-Tat) 게임 이론 - 1편

팃포탯은 무엇인가 앞서 말한 죄수의 딜레마에서 전제 조건으로 삼았던 내용을 기억하는 독자가 있을지 모르겠다. 죄수의 딜레마는 단일 게임을 가정한다. 만약 죄수의 딜레마 상황이 계속해서

poporim.com

2차 대회에는 훨씬 많은 62개 팀이 참가했다. 마찬가지로 군사 심리 경제 정치 등 여러 각 분야의 전문가들로 이루어진 팀이었으며, 재미있게도 참가자들의 경력이나 교육 연수와 같은 어떠한 인적 정보도 프로그램의 점수에는 영향을 주지 못했다. 즉 대회의 결과에 개입될 만한 변수는 없다고 봐도 무방하였다.

그리고 1차 대회에서 우승했던 똑같은 팀의 팃포탯 전략이 2차 대회에서도 압도적인 점수 차이로 우승을 차지했다. 61개의 정교한 전략들이 도전했지만, 전 회차 우승자는 우직하게 팃포탯 전략을 밀고 나갔고, 이 대회에서 더욱더 확실하게 밝혀진 사실은 팃포탯에 변형을 가하면 가할수록 오히려 승률은 감소하더라는 것이었다. 다시 말해 기존 팃포탯 전략보다 높은 점수를 얻고 싶어서 단점이라고 생각되는 부분들을 보완하면 보완할수록 그 보완된 부분 때문에 오히려 발목을 잡히고 점수를 얻지 못하게 되는 요인이 되었다.

 생각해 보면 2차 대회는 1차 대회 이후 열렸기 때문에, 사람들은 우승자인 팃포탯 전략에 대해 상당한 주의를 기울였을 것이다. 그리고 팃포탯 전략의 핵심인 소위 선량함에 대해서도 꽤 주의를 기울여 대응책을 만들었을 것이다. 그런데 재미있는 부분은 대부분 팀은 더욱 선량한 프로그램을 만들자는 것이 아니라, 선량한 프로그램들을 적당히 이용하는 프로그램 개발하는 데 주력했다. 즉 상대방이 보복을 가할 가능성을 염두에 둬서 두되 적당히 선을 지키며 상대방의 관대함과 선량함을 최대한 등쳐먹으려는 심보였다.

하지만 문제는, 팃포탯도 이에 따라 그런 야비한 프로그램들을 가려내는 데에 중점을 두기 시작했고, 한가지 간과하고 있던 점은 팃포탯은 단지 선량하고 관대하기만 한 전략이 아니라는 점이다. 선제적인 배신에는 반드시 그에 따르는 철저한 보복을 했고, 능청스럽게도 다시 협력할 수 있다는 자세를 쓱 보내오니 결국은 어떤 생각을 해보든 원하는 대로 끌려갈 수밖에 없었다.

다시 협력할 수도 있는 팃포탯 전략
다시 협력할 수도 있는 팃포탯 전략

 

팃포탯 전략의 전제조건, 한계점

언뜻 보면 팃포탯은 정말 완벽한 전략처럼 보이지만 그런데도 팃포탯에도 몇 가지 단점들은 있다. 전략이 갖는 단점이라기보다는, 적용될 수 없는 상황들이 있음으로써 발생하는 한계점 같은 것으로 생각해도 좋을 듯하다. 앞서 서술했던 팃포탯 전략이 효율적으로 되기 위한 전제조건들이 무너진 상태를 상정하면 된다.

첫째, 팃포탯은 반복적이고 장기간을 가정하기 때문에 일회성에 그치는 상황에서는 사용하기 어렵다. 쉽게 말해서 단판으로 끝나는 승부에서 선제적으로 무조건적인 협력을 택하는 전략은 위험하기 짝이 없다. 이는 당연한 이야기지만, 그렇다고 오해하지 않았으면 한다. 상호작용이 짧은 상황에서 팃포탯이 효과가 작다는 거지, 상호작용이 계속해서 반복적으로 일어나는 상황에서 팃포탯의 안정성이 크다는 것은 수학적으로도 증명된 사실이다.

둘째, 경제학에서 모든 경제주체는 합리적 의사결정을 한다는 가정으로 모든 이론은 전개된다. 따라서 게임이론도 마찬가지로, 경제주체는 합리적 의사결정을 한다는 전제하에 모두 증명되는 것들이다. 만약 어떠한 주체가 자기 마음 내키는 대로 의사결정을 한다면, 팃포탯은 어떤 반응을 보일까. 과도할 정도의 관용을 보여주곤 하는데 어떻게 생각하면, 아무 생각이 없는 상대에게는 어쩌면 전략이 없는 것이 전략일 것이다.

셋째, 상대방의 배신에 대해 팃포탯이 보복으로 응대했을 때 상대가 그것을 선제적 배반으로 인식한다면 어떻게 될까? 꼭 선제적이지 않더라도 눈에는 눈 이에는 이 전략을 상대가 채택한다면 둘은 공멸하게 될 위험이 있다. 즉 서로 보복만을 퍼붓는 악순환이 계속될 우려가 있다는 것이다.

이러한 한계점 외에도 몇 가지 한계점들이 발견되었으며, 그 외에도 팃포탯의 개선을 찾으려는 노력은 줄곧 있었다. 하지만 우리도 알다시피 세상에 완벽한 전략이란 없다. 전략이란 늘 상대적인 것이며, 상황의 변화에 따라, 그리고 수많은 변수에 따라 유동적으로 변화해야만 한다.

다음 차수에서는 팃포탯을 개선한 다른 전략들에 대해 살펴보며 팃포탯 시리즈를 마무리하려 한다.

반응형