본문 바로가기
미시경제

팃포탯(Tit-for-Tat) 게임 이론 - 3편

by poporim 2024. 1. 13.
반응형

팃포탯의 활용과 시사 

앞선 포스팅에서 설명한 바와 같이, 팃포탯 전략은 어떻게 보면 최강의 전략이라고 볼 수 있을 듯하다. 하지만 여러 가지 한계점들이 있고 이를 보완하려는 시도들은 꾸준히 이어지고 있다. 하지만 반복되는 상호작용에서 선제적인 선량함과 배신에 대한 즉각적 보복 그리고 다시 이어지는 관용적 용서와 같은 전략의 핵심들은 반드시 기억해 두고 활용해 보자.

2024.01.13 - [미시경제] - 팃포탯(Tit-for-Tat) 게임 이론 - 2편

 

팃포탯(Tit-for-Tat) 게임 이론 - 2편

팃포탯의 시뮬레이션 대회 팃포탯 전략은 상대방과의 무조건적인 협력을 전제로 시작한다. 그 이후에는 상대방의 배신에는 보복으로 대응한다. 그리고 상대방이 재차 협조를 요청하면 다시 관

poporim.com

오늘은 팃포탯 전략을 등장했던 두 개 대회에서 나왔던 그 외 재밌는 전략들을 살펴보고 이를 통해 팃포탯과 전략들에 대해 생각해 보는 시간을 갖도록 하자.

 

팃포탯 시뮬레이션 대회 새로운 전략

1. 팃포2탯
제목에서도 알 수 있듯이 이 전략은 팃포탯과 완벽히 동일하다. 다만, 상대가 두 번 연속 배반하지 않으면 보복하지 않는다. 즉, 한번은 관대함을 베풀어 용서해 주는 것이다. 이 전략이 등장하게 된 이유는 팃포탯이 상대의 의도치 않은 혹은 악의적이지 않은 배신에 대해서도 완벽하게 보복하기 때문에 상대로부터 악의를 사게 되고 잠재적으로 협력할 수 있는 기회를 뺏는다는 지적이 있었기 때문이다. 이 프로그램은 앞서 말한 2차 대회에서 등장했는데, 강력한 우승 후보가 될 것이라는 예측과는 다르게 졸전했다. 깡패 같은 프로그램들에는 나름 효과적으로 대응했지만 교활하고 영악한 프로그램들에는 거의 뺏겼기 때문이다. 특히 이후 설명하고자 하는 기회주의자 격인 테스터라는 프로그램이 거의 천적이며 압살당하는 모습을 보여주었다. 하지만 팃포2탯은 팃포탯과 만났을 때는 거의 완벽한 모습을 보여주기도 했었다.

2. 테스터
전형적인 기회주의적인 프로그램이었다. 약자에겐 더없이 무자비하고, 강자에겐 바로 화해의 손길을 내미는 형태의 프로그램이었다. 앞서 서술한 팃포2탯의 경우 테스터를 상대하기엔 지나치게 관대했고, 테스터는 이를 교활하게 이용하였다. 팃포탯과는 완전히 반대라고 볼 수 있다. 팃포탯이 선제적으로 선량함으로 대하고 배반에 즉각적인 보복으로 응징하는 프로그램이라면, 테스터는 선제적으로 배반을 생각하고 있고, 만만치 않은 상대에게 즉각적으로 화해의 손길을 내미는 프로그램이었다. 팃포탯과 만났을 때 테스터는 간을 보기 시작했고 간을 보자마자 팃포탯은 무자비한 보복으로 대응했다. 테스터는 바로 화해의 손길을 내밀기 시작했고, 둘은 무사히 협력할 수 있었다. 반면 테스터는 자기와 같은 교활한 형태의 프로그램이나, 완전히 제멋대로 행동하는 프로그램, 혹은 자기의 생각을 드러내기를 꺼리는 적에게는 유달리 취약한 모습들을 보였다.

기회를 노리는 테스터 전략
기회를 노리는 테스터 전략

3. 무조건적인 배반
이 전략은 참으로 신기한 전략이다. 간단히 말하자면 뭘 하든 무조건 배반한다는 전략이다. 언뜻 들으면 뭐 저런 마구잡이 전략이 통하겠나 싶지만, 의외로 이 전략은 매우 강한 모습을 보였다. 이 전략은 배반이든 뭐든 내가 손해 보는 일은 절대 없게 만들겠다는 모습을 보인다. 불신과 배반이 판치는 어지러운 전쟁 상황과 같다면 자주 볼 일이 많은 전략일 수도 있겠다. 놀라운 점은 이 전략을 취하는 개체들이 일단 집단의 지도자가 되고 난 이후에는 다른 대안적 전략의 개체들이 세력을 얻기가 매우 어렵다. 그러한 관점에서 볼 때 이 전략은 사실 매우 안정된 것이다.

이전 포스팅에서 설명했던 죄수의 딜레마 상황에서 우월전략은 배반이다. 

2024.01.08 - [미시경제] - 죄수의 딜레마란 무엇인가, 해결방법

 

죄수의 딜레마란 무엇인가, 해결방법

1. 개요 게임이론을 집대성한 존내쉬는 죄수의 딜레마라는 개념을 제시하였다. 영어를 번역한 것이기 때문에 용어는 여러 가지로 알려져 있기는 하다. 수인의 딜레마, 용의자의 고민 등으로 나

poporim.com

 

즉 상대방과의 협력을 아예 포기하고, 내가 손해 보는 일은 절대로 만들지 않겠다는 말이다. 그렇기 때문에 아이러니하게도, 진화론적으로는 참으로 안정된 전략이다. 그렇다면 우리 사회 전반에는 배신과 배반이 깔려있어야 하겠지만, 대부분의 경우 그렇지 않은 이유는 팃포탯이 더욱 강력한 전략이기 때문이다. 하지만 바꿔 이야기하면 팃포탯을 제외한 대부분의 다른 전략들은 이 전략을 이기기 힘들다는 이야기도 된다.

아이러니하지 않는가. 경제학적인 전략에서 우리 사회의 이면들을 다시금 살펴보며 삶과 사회에 대해 생각할 계기가 된다.

반응형