가위바위보 진화 시뮬레이션: 생태계의 순환과 전략의 역학 관계 분석
Simulating the Evolution of Rock, Paper, Scissors by Primer
가위바위보 게임을 통해 생물학적 진화와 전략의 역학 관계를 탐구하는 영상입니다. 자연계에 존재하는 순환적 경쟁 관계를 시뮬레이션으로 구현하여, 특정 전략이 어떻게 지배력을 얻고 도태되는지, 그리고 어떻게 생태계의 균형이 유지되는지를 심층적으로 분석합니다.
-
자연계의 순환적 관계와 가위바위보
- 가위바위보는 바위가 가위를 이기고, 가위가 보를 이기며, 보가 바위를 이기는 순환 구조를 가집니다.
- 실제 자연에서도 이러한 관계가 발견되며, 대표적인 예로 옆점박이도마뱀(Common side-blotched lizard) 이 있습니다.
- 옆점박이도마뱀 수컷의 세 가지 목 색깔 전략:
- 주황색 목: 매우 공격적이며 넓은 영토를 지배하여 파란색 목을 압도합니다.
- 파란색 목: 영토가 작지만 노란색 목보다 경쟁 우위에 있습니다.
- 노란색 목: 영토를 소유하지 않지만, 주황색 목의 넓은 영토에 몰래 침입하여 번식에 성공함으로써 주황색 목을 이깁니다.
-
시뮬레이션 기본 규칙 설정
- 개체들은 하루만 생존하며, 가위바위보 결과로 얻은 먹이(망고)의 양에 따라 번식합니다.
- 승자 독식 시스템: 승자는 망고 2개를 얻어 2마리의 자손을 낳고, 패자는 망고를 얻지 못해 자손을 남기지 못합니다.
- 비김: 두 개체가 같은 전략을 내면 각각 망고 1개를 얻어 자손을 1마리씩 남깁니다.
- 보상은 보상 행렬(Reward Matrix) 을 통해 정의됩니다.
-
초기 시뮬레이션 결과: 외향적 나선
- 80마리의 개체로 시작했을 때, 특정 전략이 무작위로 전체 인구의 지배권을 장악합니다.
- 인구 변화의 가독성을 높이기 위해 삼각 도표(Ternary Plot) 를 활용합니다.
- 삼각형의 각 꼭짓점은 특정 전략이 100%인 상태를 나타냅니다.
- 삼각형 내부의 점은 세 가지 전략이 섞인 비율을 의미합니다.
- 시뮬레이션 결과, 인구는 중앙에서 시작하여 바깥쪽으로 나선형을 그리며 확장됩니다.
- 결국 불균형이 심화되어 한두 가지 전략이 멸종하고 하나의 전략만 남게 됩니다.
-
변이(Mutation)의 도입
- 복제 시 10,000분의 1 확률로 다른 전략으로 변이하는 규칙을 추가합니다.
- 특정 전략이 지배하고 있을 때, 그 전략을 이기는 변이 개체가 등장하면 급격히 인구를 잠식합니다.
- 이 과정이 무한히 반복되며 지배적인 전략이 계속 순환합니다.
- 내시 평형(Nash Equilibrium) 관점에서 볼 때, 순수 전략 상태에서는 어떤 개체도 전략을 바꿔서 이득을 볼 수 없는 상태가 존재하지 않으므로 지속적인 변화가 일어납니다.
-
생태계 균형을 위한 보상 체계 수정
- 보상 격차 완화: 승자가 1.5개, 패자가 0.5개의 망고를 가져가게 설정했으나, 여전히 나선형으로 확장하며 불안정한 모습을 보였습니다.
- 비김에 대한 페널티 추가: 같은 전략끼리 비길 경우 에너지를 소모하여 번식력이 낮아지도록 설정(예: 망고 1개 미만 수준의 효율)했습니다.
- 결과적으로 인구는 중앙으로 안쪽을 향해 나선형을 그리며 수렴했습니다.
- 이는 특정 전략이 너무 많아지면 자기들끼리 경쟁(비김)하는 비용이 커져서 스스로 개체수가 조절되는 원리입니다.
-
혼합 전략(Mixed Strategies)의 탐구
- 개체가 단일 전략이 아닌 가위, 바위, 보 중 확률적으로 선택하는 유전자를 가집니다.
- 중립 전략(Brown bar) : 가위, 바위, 보를 정확히 3분의 1 확률로 내는 개체입니다.
- 중립 전략은 어떤 전략에게도 평균적으로 지지 않지만 이기지도 않는 약한 내시 평형(Weak Nash Equilibrium) 상태를 만듭니다.
- 비김 페널티가 존재하는 환경에서 중립 전략은 변이의 침입을 방어합니다.
- 다른 혼합 전략들은 자기 자신과 만났을 때 비김 페널티를 더 많이 받지만, 완벽하게 섞인 중립 전략은 효율적으로 생존합니다.
- 이를 진화적으로 안정적인 전략(Evolutionarily Stable Strategy) 이라고 부릅니다.