(2) 로버트 액설로드의 실험

(2) 로버트 액설로드의 실험


1회성 죄수의 딜레마 상황이 아니라, 10회, 100회, 200회가 반복된다면, 인간은 여전히 모두가 손해를 보는 선택만 하게 될지…아니면 협력을 통해 전체의 이익을 높이는 선택을 하게 될지…


로버트 액설로드는 이것을 모델로 하여 컴퓨터 프로그램끼리의 대회를 열었다. 과연 다양한 전략들끼리의 경합에서 어떠한 전략이 가장 높은 점수를 차지할 것인가? 대회는 모든 전략들이 무작위적으로 대결하되 각 200회씩 아래와 같은 규칙으로 게임을 하게 된다. 


둘 다 협력하면 둘 다 3점, 


둘 다 배반하면 둘 다 1점,


상대는 배신하지 않았는데, 나는 상대의 뒤통수를 쳤다면 나만 5점, 상대는 0점이다.


이러한 규칙 하에서, 우리의 모습과도 같은 컴퓨터 프로그램들끼리 게임을 벌인다.



과연, 어떤 전략을 취하는 것이 제일 높은 점수를 올릴까?


 


사람들의 이 세상에서 취하는 각종 전략들과 유사한 각종 스타일의 프로그램들을 살펴보자.














































랜덤



50 : 50 확률로 배신과 협력을 무작위적으로 반복. 아무 생각이 없이 선택한다.



다우닝1



잔머리 굴리는 유형. 상대방의 패턴을 파악하고 응대하려고 한다. 그런데, 상대방이 최초에는 배신할 거라고 생각하고 자기도 일단 배신해보는 비관적인 유형.



다우닝2



다우닝1처럼 머리를 굴리는데, 단, 처음에는 협력할 거라고 가정하는 낙천적인 유형. 그러므로 처음에 협력부터 시작한다.



테스터



일단 처음엔 배반. 그 다음엔 팃포탯. 즉, 처음에 배반해봐서, 테스트를 통해 상대방이 봐주면 계속 배반하고, 안 봐주면 고분고분 잘 협력해준다.



올디



언제나 배신한다. 아주 치사하고 나쁜 사기꾼 같은 유형. 상대방이 어떻게 나오건 일관적으로 계속 남을 뒤통수 치는 배신밖에 모르는 유형이다.



프리드먼



기본적으로 팃포탯과 같지만 단 하나, 용서를 모른다. 한번 자기를 배신한 유형과는 죽어도 다시 협력하지 않는다.



트랜퀼라이저



협력 잘 하다가 느닷없이 뒤통수친다.



요스



10% 확률로 배반한다. 즉, 지금까지 잘 해왔으니 상대방이 봐주지 않을까 하는 요행을 바라는 유형이다.



해링턴



착취적 전략을 먹잇감으로 삼는다. 즉 사기꾼 머리 위에 있는 사기꾼.



룩어헤드



인공지능, 매우 계산적인 유형. 패턴을 분석하고 예측하여 선택함.


★ 오늘의 주인공!


팃포탯 : 눈에는 눈 이에는 이. 처음에는 상대방이 협력할 거라고 가정하고 자기도 협력을 해 준다. 그런데 상대방이 배신한다면, 다음 게임에서 자기도 배신한다. 배신에는 배신, 협력에는 협력으로 갚는다. 그렇지만 세 번째 게임에서는 다시 모든 기억을 지우고, 협력을 다시 시도한다. 즉, 용서해준다. 단순하게 이것뿐이다.



이렇게 다양한 전략들이 경합을 벌였는데, 이긴 것은 팃포탯이다. 이 게임에서는 200회의 게임을 벌이므로 최고로 얻을 수 있는 점수는 200회 모두 서로 협력했을 때의 600점, 최하로 얻을 수 있는 점수는 200회 모두 서로 배신했을 때의 200점이다. 팃포탯의 평균점수는 504점이다.


먼저 배신하지 않는 유형들은 다들 높은 점수를 기록했다. 상위 10위권 중 8개가 이런 ‘신사적인’유형들이다. 평균 472~504점. 그러나 상대방이 어떤 지도 모르는 상태에서도 무조건 첫 판부터 배신하고 보는 유형들은 제일 점수가 높은 것도 401점밖에 안된다.


먼저 배신하지 않는 것이 결국 이긴다는 결론이다.


 

이 실험은 2차 대회까지 이어진 후 가상 시뮬레이션으로 동일한 등장인물들이 1000세대 넘어서까지 진행되었다. 결론은, 거의 언제나 팃포탯의 승리!! 1위는 언제나 팃포탯이었다.


 온갖 전략들이 난무하는 세상에서도, 단순한 팃포탯은 언제나 이겼다.



모두 배신만 하는 비열함으로 가득한 세상 즉 올디만의 세상을 가정했을 때도, 팃포탯은 자기랑 같은 신사적인 협력게임을 할 만한 파트너가 있다면 그곳을 파고들어 이길 수 있었다. 올디들은 전략적으로 안정되어 있어서 게임당 상대가 어떤 태도를 취하든 1점은 번다. 가끔 상대가 처음에는 순진하게 자기를 믿어 줄 경우 5점도 벌 수 있다. 그러므로 손해 볼 게 없다. 그렇지만 올디들은, 결코 더 나아갈 수 없다. 아무것도 만들어내지 못한다. 더 이상의 점수 획득은 불가능하다.

답글 남기기