위키백과 '철학 게임'의 수학적 분석과 지식의 위계
How One Small Change Broke Wikipedia's First Link Rule by Not David
이 영상은 위키백과의 임의 문서에서 첫 번째 링크를 계속 클릭하면 결국 '철학' 문서에 도달하게 된다는 현상을 데이터 분석과 네트워크 이론을 통해 증명하고, 이 견고한 구조가 어떻게 인위적인 편집에 의해 무너졌는지를 탐구합니다.
-
위키백과 첫 번째 링크 게임의 개요
- 규칙은 단순합니다. 임의의 문서에서 시작하여 본문의 첫 번째 링크를 계속 클릭합니다.
- 이 과정을 반복하면 약 **97%**의 문서가 결국 철학(Philosophy) 문서로 수렴합니다.
- 분석 과정에서 제외되는 요소들:
- 문서 상단의 아이콘이나 발음 기호(IPA) 링크.
- 출처 및 각주 링크.
- 언어 배제 규칙: 괄호 안에 있는 원어 표기 링크는 무시합니다. 이는 문서가 다루는 주제의 본질적인 정의를 따라가기 위함입니다.
- 예시: '플라스틱 러브' 문서는 언어 배제 규칙을 적용하지 않으면 '일본어'로 가지만, 규칙을 적용하면 '다케우치 마리야' → '시티 팝' → '제이팝' 순으로 본질적인 정의를 따라갑니다.
-
네트워크 데이터 분석 결과
- 5,000개의 문서를 샘플링하여 시각화했을 때, 거대한 네트워크의 중심에 철학 문서가 위치합니다.
- 도달하는 데 걸리는 평균 횟수는 약 14회이며, 종 모양의 정규 분포를 보입니다.
- 철학에 도달하는 경로는 크게 세 갈래의 거대한 로브로 나뉩니다:
- 분석 철학(Analytic Philosophy) 경로 (53%) : 주로 과학과 국가 관련 문서들이 이 경로를 통해 철학에 도달합니다.
- 인식(Awareness) 경로 (25%) : 정치 및 학술 기관 관련 문서가 주를 이루며, 흥미롭게도 수학의 모든 문서가 여기에 포함됩니다.
- 논리 철학(Philosophy of Logic) 경로 (15%) : 언어와 논리학 관련 문서들이 포함됩니다.
- 나머지 7%는 철학에 도달하지 못하는 작은 섬들로, 루프(순환)에 빠지거나 링크가 없는 문서들입니다.
-
왜 '철학'인가?: 네트워크 이론적 근거
- 연결 중심성(Degree Centrality) : 단순히 연결된 링크 수가 많은 문서입니다. '축구'는 51개, '나방'은 17개의 유입 링크를 가져 철학(10개)보다 높지만, 게임의 이름이 되지는 않았습니다.
- 매개 중심성(Betweenness Centrality) : 네트워크 내에서 노드 간의 최단 경로를 이어주는 다리(Bridge) 역할을 측정하는 지표입니다.
- 철학 문서는 전체 네트워크에서 가장 높은 매개 중심성을 가집니다. 즉, 서로 다른 지식 체계 사이를 연결하는 결정적인 가교 역할을 합니다.
- 철학 자체가 하나의 거대한 루프(11개 혹은 16개 노드) 안에 포함되어 있어 한 번 진입하면 빠져나갈 수 없다는 특징도 게임 성립의 핵심입니다.
-
시스템의 붕괴: 인위적 편집에 의한 변화
- 영상 제작 과정 중 누군가 '인식' 문서의 첫 번째 링크를 '심리학'으로 리다이렉트했습니다.
- 이 작은 변화로 인해 전체 지식 네트워크의 25%가 철학으로 가는 길을 잃고 새로운 루프에 갇히게 되었습니다.
- 이는 네트워크의 약점 공격(Targeted Attack) 사례로 설명됩니다.
- 도시 전력망 공격은 재앙이지만, 암세포의 대사 네트워크 공격은 치료가 되는 것처럼 네트워크 구조 파악은 방어와 공격 모두에 중요합니다.
- 위키백과의 편집 기록을 추적한 결과, 영상의 예고편이 공개된 직후 이러한 수정이 발생한 것으로 보아 의도적인 방해 공작일 가능성이 높습니다.
-
두 번째, 세 번째 링크의 네트워크 형태
- 첫 번째 링크가 아닌 두 번째, 세 번째, 다섯 번째 링크를 따라가면 네트워크는 급격히 파편화됩니다.
- 철학 도달 확률: 두 번째 링크는 2%, 세 번째는 1%, 다섯 번째는 0%에 수렴합니다.
- 링크 순서가 뒤로 갈수록 네트워크 구조는 거대한 덩어리가 아닌 가느다란 줄기 형태로 변합니다.
- 이는 인간의 정의 방식에 대한 합의를 반영합니다:
- 첫 번째 링크는 주제를 더 상위의 보편적인 개념으로 맥락화하려는 집단적 합의를 담고 있습니다.
- 뒤로 갈수록 해당 주제만의 개별적인 속성을 나열하므로 공통 분모가 사라지고 구조가 해체됩니다.
-
결론: 지식의 위계와 인류의 자화상
- 위키백과는 인류가 가진 우주에 대한 모든 지식을 담으려는 거대하고 무질서한 시도입니다.
- 그 구조를 분석하는 것은 단순히 수학적 유희를 넘어, 우리가 세상을 어떻게 분류하고 연결하며 이해하고 있는지를 비추는 거울과 같습니다.
- 철학이 모든 지식의 종착지가 되는 것은 인류가 수천 년간 쌓아온 지식의 위계 질서가 반영된 결과입니다.