본문 바로가기
게임이론

[완벽한전략3편] 티포텟(Tit-for-Tat)의 등장: 가장 단순한 규칙이 천하를 통일하다

by 퀀트쟁이 2026. 3. 22.
반응형


안녕하세요! '나노바나나와 함께하는 게임이론' 시리즈, 그 세 번째 시간입니다.

지난 2편에서 우리는 '죄수의 딜레마'라는 절망적인 감옥에 갇혔었습니다. 기억하시나요? 각자가 자기 이익만 챙기려다 결국 둘 다 나락으로 떨어지는 그 씁쓸한 결말 말이죠. 많은 독자분이 댓글로 "세상이 정말 이렇게 비정하기만 한가요?"라며 탄식을 보내주셨습니다.

하지만 걱정 마세요. 오늘, 그 차가운 나노바나나 감옥의 벽을 부수고 나타난 구원자, 티포텟(Tit-for-Tat, 이하 TFT) 전략을 소개합니다. 이 전략은 너무나 단순해서 초등학생도 1초 만에 이해할 수 있지만, 전 세계의 천재 수학자들을 경악하게 만든 '전설의 전략'입니다.


이야기는 1980년으로 거슬러 올라갑니다. 정치학자 로버트 액설로드(Robert Axelrod)는 한 가지 거대한 실험을 기획합니다.

"죄수의 딜레마 상황이 수없이 반복된다면, 과연 어떤 전략이 최후의 승자가 될까?"

그는 전 세계의 게임이론가, 수학자, 경제학자, 심리학자들에게 초대장을 보냈습니다. 각자의 필승 전략을 컴퓨터 프로그램으로 짜서 제출하라는 것이었죠. 이른바 '제1차 컴퓨터 죄수의 딜레마 토너먼트'였습니다.

여기에 참여한 천재들은 온갖 복잡한 알고리즘을 들고 나왔습니다.

  • "상대의 배신 확률을 실시간으로 계산해서 대응하는 확률 모델"
  • "초반에는 협력하다가 특정 시점에 배신해서 이득을 극대화하는 기회주의 모델"
  • "수천 줄의 코드로 이루어진 초거대 인공지능형 모델"

그런데 이 쟁쟁한 괴물들을 제치고 우승을 차지한 것은, 단 '4줄'의 코드로 이루어진 프로그램이었습니다. 바로 아나톨 라포포트(Anatol Rapoport) 교수가 제출한 티포텟(Tit-for-Tat)이었습니다.


티포텟의 규칙은 허무할 정도로 간단합니다. 딱 두 가지만 기억하면 됩니다.

  1. 첫 번째 만남에서는 무조건 '협력'한다.
  2. 두 번째부터는 '상대방이 바로 직전에 했던 행동'을 그대로 따라 한다.

즉, 상대가 나를 도와주면 나도 도와주고, 상대가 나를 때리면 나도 즉각 한 대 때리는 전략입니다. 썸네일에서 보셨던 그 단단한 나노바나나 방패는 바로 이 단순함에서 나오는 강력한 방어력을 상징합니다.


액설로드는 우승한 티포텟을 분석하며 큰 충격을 받았습니다. 그리고 티포텟이 승리할 수밖에 없었던 이유를 네 가지 키워드로 정리했습니다. 이것은 여러분이 인생을 살아가는 데 있어서도 엄청난 통찰을 줄 것입니다.

티포텟은 절대 먼저 뒤통수를 치지 않습니다. 무조건 '협력'으로 시작하죠. 이는 '나노바나나' 세계에서 상호 협력의 고리($R$)를 만들 수 있는 최적의 시작점입니다. 배신자들끼리는 서로를 파괴하느라 바쁠 때, 티포텟은 다른 신사적인 전략들을 만나 차곡차고 점수를 쌓아 나갑니다.

티포텟은 '호구'가 아닙니다. 상대가 한 번이라도 배신하면, 바로 다음 차례에 똑같이 배신으로 응징합니다. 상대에게 "나를 만만하게 보지 마, 네가 배신하면 나도 배신할 거야"라는 명확한 신호를 보내는 것이죠. 이 단호함이 상대의 추가 배신을 억제합니다.

이게 정말 중요합니다. 티포텟은 응징한 뒤에 상대가 다시 협력으로 돌아오면, 과거를 묻지 않고 즉시 협력으로 복귀합니다. "너 아까 나 배신했지? 나도 계속 배신할 거야!"라는 식의 감정적인 보복의 늪에 빠지지 않습니다. 언제든 평화로운 관계로 돌아갈 문을 열어두는 것이죠.

상대방 입장에서 티포텟은 예측하기가 너무 쉽습니다. "아, 저 녀석은 내가 잘해주면 잘해주고, 내가 못해주면 못해주는구나!"라고 금방 깨닫게 되죠. 상대방이 합리적이라면, 결국 티포텟과 협력하는 것이 자신에게도 이득이라는 결론에 도달하게 됩니다.


자, 이제 조금 더 깊이 들어가 봅시다. 5,000자 이상의 밀도를 채우기 위해 우리는 '진화론적 관점'에서 티포텟을 바라봐야 합니다.
배신이 판치는 정글 같은 세상에서 티포텟 같은 '착한 전략'이 어떻게 살아남을 수 있었을까요?
처음에는 배신자(All-D: 항상 배신하는 전략)들이 득세합니다. 그들은 착한 사람들의 등골을 빼먹으며 점수를 올리죠. 하지만 시간이 흐를수록 착한 사람들은 전멸하고 배신자들만 남게 됩니다. 배신자들끼리 남으면 어떻게 될까요? 서로를 배신하느라 낮은 점수($P$)만 받게 되어 모두가 굶어 죽게 됩니다.

이때 티포텟 무리가 등장하면 판도가 바뀝니다. 티포텟들은 배신자에게는 단호하게 대응해 피해를 최소화하고, 자기들끼리 만났을 때는 '무한 협력'을 통해 점수를 폭발적으로 쌓습니다. 결국 장기적으로는 티포텟 무리가 배신자 무리를 압도하고 세상을 지배하게 됩니다.

이것이 바로 '협력의 진화'입니다. 착해서 이기는 것이 아니라, 이기기 위해 착해지는 시스템인 것이죠.


티포텟은 컴퓨터 속의 숫자 놀이가 아닙니다. 자연계와 인류 역사 곳곳에 숨어 있습니다.

  • 흡혈박쥐의 우정: 피를 빨지 못하면 죽는 흡혈박쥐들은 동료에게 피를 나눠줍니다. 재미있는 건, 예전에 나에게 피를 나눠준 박쥐에게는 흔쾌히 나눠주지만, 나를 외면했던 박쥐에게는 절대 나눠주지 않는다는 겁니다. 완벽한 티포텟이죠.
  • 1차 세계대전의 '라이브 앤 렛 라이브(Live and Let Live)': 끔찍한 참호전 속에서도 병사들은 암묵적인 협력을 했습니다. "우리가 밥 먹는 시간에는 안 쏠 테니, 너희도 쏘지 마." 만약 한쪽이 약속을 어기고 총을 쏘면? 상대방은 즉시 대포로 응징했습니다(응징). 그리고 다시 조용해지면 다시 사격을 멈췄죠(용서).

오늘 내용을 정리하며, 여러분의 삶에 적용할 세 가지 원칙을 제안합니다.

  1. 먼저 '나이스'하게 시작하세요. 세상이 험하다고 먼저 가시를 세울 필요는 없습니다. 협력의 가능성을 먼저 여는 사람이 결국 더 큰 파이를 얻습니다.
  2. 하지만 '호구'는 되지 마세요. 무조건적인 친절은 상대의 배신을 부추깁니다. 부당한 대우에는 명확하고 즉각적인 피드백(응징)을 줘야 합니다.
  3. 사과하면 쿨하게 받아주세요. 과거의 잘못에 얽매여 관계를 파괴하는 것은 당신에게도 손해입니다. 상대가 태도를 바꿨다면 당신도 즉시 태도를 바꿔 협력의 이득을 챙기세요.

자, 이렇게나 완벽해 보이는 티포텟에게도 치명적인 약점이 하나 있습니다. 바로 '오해'라는 이름의 나노바나나 껍질이죠.

상대는 협력하려고 했는데, 중간에 소통의 오류가 생겨서 내가 '배신'으로 오해했다면 어떻게 될까요? 나는 응징하고, 상대는 다시 보복하고... 끝없는 복수의 소용돌이(Vendetta)에 빠지게 됩니다.

과연 티포텟은 이 위기를 어떻게 극복할까요? 다음 [4편: 로버트 액설로드의 토너먼트 - 티포텟은 어떻게 천하통일을 했나?]에서 그 흥미진진한 뒷이야기를 이어가겠습니다!


오늘의 질문:
여러분 주변에 티포텟처럼 행동하는 사람이 있나요? 아니면 항상 배신만 하거나 무조건 참기만 하는 사람이 있나요? 그들의 마지막은 보통 어떤지 댓글로 공유해 주세요!

반응형