[완벽한전략4편] 전설의 시작: 전 세계 천재들을 무릎 꿀린 4줄의 코드

안녕하세요! '나노바나나와 함께하는 게임이론' 시리즈, 벌써 네 번째 시간입니다.

지난 3편에서 우리는 '티포텟(Tit-for-Tat)'이라는 단순하기 짝이 없는 전략이 등장했다는 소식을 전해드렸습니다. 오늘은 그 티포텟이 실제로 어떻게 전 세계의 내로라하는 천재들을 '참교육'하고 천하통일을 이뤄냈는지, 그 역사적인 컴퓨터 토너먼트의 현장으로 여러분을 안내합니다.

썸네일에서 보셨던 그 압도적인 승리의 순간, 나노바나나 시상대 맨 위에서 빛나던 티포텟의 비결을 파헤쳐 봅시다.

1970년대 후반, 미시간 대학교의 정치학자 로버트 액설로드는 전 세계에 격문을 보냅니다. "죄수의 딜레마 상황에서 가장 높은 점수를 얻을 수 있는 전략을 보내달라"는 것이었죠.
이 부름에 응답한 이들은 평범한 사람들이 아니었습니다. 경제학, 수학, 정치학, 사회학 등 각 분야에서 '전략' 하나만큼은 자신 있다는 석학들이었습니다. 제출된 프로그램은 총 14개. 이들은 메인프레임 컴퓨터라는 가상의 링 위에서 서로를 마주하게 됩니다.
제출된 전략들의 면면은 화려했습니다.

교활한 배신자형: 상대의 패턴을 분석해 90% 정도 협력하다가 막판에 뒤통수를 쳐서 점수를 챙기는 전략.
치밀한 분석가형: 상대의 과거 10수 이상을 통계적으로 분석해 다음 수를 예측하는 복잡한 알고리즘.
랜덤형: 아무 생각 없이 무작위로 선택해 상대의 머리를 아프게 하는 전략.

그리고 여기에, 우리가 아는 아나톨 라포포트 교수의 '티포텟'이 끼어 있었습니다. 당시 다른 참가자들은 티포텟의 코드를 보고 코웃음을 쳤을지도 모릅니다. "고작 4줄짜리 코드가 뭘 할 수 있겠어?"라면서요.

이번 토너먼트의 핵심은 '반복'이었습니다. 한 번만 만나고 헤어지는 것이 아니라, 똑같은 상대를 200번씩 만나는 구조였죠.

2편에서 우리가 배운 '죄수의 딜레마' 보상 체계를 기억하시나요?

둘 다 협력: 3점 (성공적인 나노바나나 수확)
나만 배신: 5점 (상대의 바나나를 훔침)
상대만 배신: 0점 (내 바나나를 털림)
둘 다 배신: 1점 (서로 바나나를 지키느라 싸움만 함)

단 한 번의 승부라면 '배신(5점)'이 최고지만, 200번을 만난다면 이야기가 달라집니다. 내가 이번에 배신해서 5점을 얻어도, 다음 판에 상대가 나를 외면하면 나는 계속 1점밖에 못 얻게 되니까요. 액설로드는 이 200번의 만남을 모든 참가자가 서로 돌아가며 수행하게 했습니다.

드디어 결과가 발표되었습니다. 결과는 충격적이었습니다.

가장 복잡하고 치밀한 알고리즘들이 하위권으로 밀려나는 동안, 티포텟이 당당히 1위를 차지했습니다. 티포텟의 승점은 평균적으로 가장 높았고, 무엇보다 어떤 상대를 만나도 '박살 나지 않는' 꾸준함을 보여주었습니다.

액설로드는 이 결과를 믿을 수 없어 참가자들에게 다시 기회를 주었습니다. "결과를 봤지? 이제 티포텟을 꺾을 수 있는 더 정교한 전략을 보내봐!"

두 번째 토너먼트에는 무려 62개의 전략이 모였습니다. 첫 번째 대회 결과를 분석한 수많은 '티포텟 킬러'들이 등장했죠. 하지만 결과는? 또다시 티포텟의 우승이었습니다.

5,000자의 깊이를 위해 우리는 여기서 '왜?'라는 질문에 집착해야 합니다. 티포텟이 천재들의 알고리즘을 이길 수 있었던 진짜 이유는 무엇일까요?

티포텟은 상대를 이기려 하지 않았습니다. 실제로 티포텟은 어떤 단일 대결에서도 상대방보다 높은 점수를 얻은 적이 없습니다. 기껏해야 비기거나, 배신자에게 몇 점 뒤처질 뿐이죠.

하지만 티포텟은 '협력하는 사람들끼리의 점수'를 폭발적으로 높였습니다. 티포텟이 다른 '나이스'한 전략을 만나면 둘은 200번 내내 협력하며 각각 600점(3점 x 200)을 챙깁니다. 반면, 상대를 이기려 드는 배신자들은 서로 배신하느라 200점 근처에서 머물렀죠.

이것이 바로 나노바나나 시상대 위에서 티포텟이 웃을 수 있었던 이유입니다. "너를 이기는 것보다, 우리가 같이 잘 먹고 잘사는 게 나의 점수를 가장 높인다"는 역설적인 진리를 증명한 것입니다.

티포텟은 자비롭지만 만만하지 않습니다. 배신자가 슬쩍 뒤통수를 치는 순간, 티포텟은 다음 수에서 지체 없이 '배신'으로 응징합니다. 이 즉각적인 피드백은 배신자에게 "너, 나한테 그러면 손해라는 걸 바로 알려줄게"라는 메시지를 던집니다. 복잡한 전략들은 상대를 분석하느라 응징의 타이밍을 놓치거나 너무 과하게 보복했지만, 티포텟은 딱 받은 만큼만 돌려주며 균형을 잡았습니다.

많은 전략이 한 번 배신당하면 끝까지 보복하는 '원한' 코드를 가지고 있었습니다. 하지만 티포텟은 상대가 다시 협력하면 바로 과거를 잊어줍니다. 이 '쿨함' 덕분에 한 번의 실수로 관계가 파탄 나는 것을 막고 다시 3점씩 쌓아가는 평화로운 상태로 돌아갈 수 있었습니다.

액설로드의 토너먼트 결과는 우리에게 세상을 살아가는 완벽한 가이드를 제시합니다.

성공하고 싶다면 주변을 성공시켜라: 티포텟의 가장 큰 강점은 '상대가 높은 점수를 얻도록 돕는 능력'이었습니다. 내가 만나는 사람들을 잘살게 만들 때, 나의 평균 점수도 올라갑니다.
전략은 단순해야 한다: 복잡한 전략은 상대방에게 오해를 불러일으킵니다. "저 사람은 대체 무슨 생각을 하는 거지?"라는 의구심이 들게 하면 상대는 방어적으로 변하고 결국 배신을 택합니다. 명확하고 투명한 태도가 신뢰라는 나노바나나 네트워크를 만듭니다.
첫 단추는 무조건 '긍정'이다: 티포텟이 첫 수에서 배신을 했다면 결코 우승할 수 없었을 것입니다. 선의를 먼저 베푸는 것은 도덕의 문제가 아니라, '최고의 수익률을 내는 투자'입니다.

자, 티포텟이 두 번의 대회를 휩쓸며 천하통일을 하는 모습을 보며 우리는 환호했습니다. "역시 착하고 강한 게 최고야!"라면서요.

하지만 현실 세계에는 컴퓨터 토너먼트에는 없었던 치명적인 변수가 존재합니다. 바로 '노이즈(Noise)'입니다. 내가 협력했는데 통신 오류로 상대방에게는 배신으로 전달된다면? 혹은 내가 의도치 않게 실수를 저질렀는데 상대방이 그걸 '공격'으로 받아들인다면?

완벽해 보이던 티포텟의 방패에 금이 가기 시작하는 지점이 바로 여기입니다. 단 한 번의 오해가 영원한 보복의 굴레를 만든다면, 티포텟은 여전히 승자일까요?

다음 [5편: 승리자의 자격 ① - 먼저 손을 내미는 ‘신사적(Nice)’ 태도의 힘]에서는 티포텟의 첫 번째 강력한 기둥인 '나이스함'을 집중적으로 분석하며, 동시에 현실의 '오해'라는 괴물에 어떻게 맞서야 하는지 알아보겠습니다.

오늘의 생각거리:
여러분은 회사나 학교에서 '단순하고 투명한 사람'인가요, 아니면 '속을 알 수 없는 전략가'인가요? 어느 쪽이 장기적으로 더 많은 이득을 얻었는지 곰곰이 생각해보세요.

저작자표시 비영리 변경금지 (새창열림)

'게임이론' 카테고리의 다른 글

[완벽한전략6편] 당하면 갚아주고, 사과하면 잊는다: 당신의 인생을 바꿀 '황금 비율' (0)	2026.03.25
[완벽한전략5편] 착한 놈이 꼴찌라고? 게임이론은 "착한 놈이 지배한다"고 말한다 (0)	2026.03.24
[완벽한전략3편] 티포텟(Tit-for-Tat)의 등장: 가장 단순한 규칙이 천하를 통일하다 (1)	2026.03.22
[완벽한전략2편] 죄수의 딜레마: 왜 우리는 서로를 배신하는가? (비극의 수학적 증명) (0)	2026.03.21
[완벽한전략1편] 당신의 모든 선택 뒤에 숨겨진 수학: 게임이론의 세계로 (0)	2026.03.20

비트코인 경제학 퀀트 의식의 흐름

[완벽한전략4편] 전설의 시작: 전 세계 천재들을 무릎 꿀린 4줄의 코드

'게임이론' 카테고리의 다른 글

티스토리툴바

[완벽한전략4편] 전설의 시작: 전 세계 천재들을 무릎 꿀린 4줄의 코드

'게임이론' 카테고리의 다른 글

관련글

티스토리툴바