투덜투덜 경제공부/차근차근 미시경제
전략형 vs 확장형
손님사절
2009. 2. 10. 06:37
여느 액션영화가 그렇겠지만 테크노 스릴러라는 장르들은 대게 패턴이 있다. 미국의 (간혹 영국) 비밀요원이 행동을 하다가 뭔가 알아냈다. 악당(이라기 보다는 영화상 악역)에게 잡혔다. 여기서 주인공 비밀요원은 온갖 능력을 발휘하며 탈출하려고 하는데, 문제는 주인공이 속한 조직이 여기서 협상을 하느냐 강경책을 피느냐 둘중 하나다. 그런데 보면 알겠지만 협상은 하다가 만다. 내지는 협상을 미끼로 주인공이 탈출하거나 강경책으로 상대조직을 타격한다.
그런데 이게 게임이론에 뭐가 중요하냐면, 미국은 대게 대외협상에서 강경책을 편다. 도덕이고 나발이고 간에 일단 이득을 보면 땡이다. ('합리적이다 = 이기려고 용쓴다' 기억하는가?) 2008년 말/2009년 초 팔레스타인 사태를 즈음해서 인도적으로 보이는 오바마 대통령 마저도 아직까지는 안보리에 반대의사를 명확히 표현안하고 있는 것을 보면 미 외교당국은 꽤나 강경한 편이다.
도덕적 비난을 받으면서 왜 그럴까? 미국은 상대가 온건하게 나오건 강경하게 나오건 상관없다. 온건하게 나오면 적대할 이유가 없고 강경하게 나오면 첨단무기로 공격하면 그만이다. 게다가 경제규모가 빵빵해서 무기를 사용해도 크게 타격을 입지도 않는다.
여기서 이 전략을 일단 크게 나누어 보자. 내가 좋은 전략이 있고 내가 하면 안좋은 전략이 있다. 이를 두고 게임이론에서는 우월전략(dominate)과 열등전략(dominated)으로 구분하는데, 우리가 잘 아는 죄수의 딜레마를 통해 보면 좀 더 쉬워진다.
여기서는 용어를 잠시 정리하고 가야되는데
각각의 동그라미들은 마디(node)라고 한다. 그리고 시작이 되는 마디는 뿌리(초기점:initial node)라고 하고 맨 아래있는 점들을 종결마디(terminal node)라고 한다. 그리고 한 마디에서 다른 마디로 가기 위한 가지(branch)와 그 마디를 합쳐서 하위게임(subgame)이라고 한다. (참조 : http://plato.standfor.edu/entries/game-theory, 김영세 "게임이론")
용어는 이 정도로 하고 첫번째 분기점(초기점)에서는 용의자1이 선택하고 그 다음에는 용의자2가 선택한다고 하자.
그럼 어떤 방법으로 이걸 풀어야 하나 싶은데 이런 경우에는 거꾸로 가면된다. 이런 방법은 어려운 말로 역진귀납법 또는 Zermelo's argorithm 이라고 불린덴다.
즉 아래에서 부터 출발하면 되는건데, 종결마디에서는 진행이 안되니까 중간의 서브게임부터 봐야한다. 그래서 일단, 3번 마디를 보면 용의자2의 선택은 무죄방면 되느냐 2년형을 사느냐 둘 중 하나이다. 선수는 다 이기려고 용쓰니까 당연히 무죄방면이 되는 '불어'를 선택하게된다. 2번 마디를 보면 5년 형이냐 10년 형이냐 둘 중 하나이므로 당연히 '불어'를 선택한다. 근데 지금 선택한다는 말은 다른건 죽어도 선택 안한다는 소리다. 즉, 종결마디의 두번째것과 네번째 것은 이제 아웃 오브 안중이란 소리다.
그럼 이제 초기점으로 가서 본다면 용의자1에게는 '불어'일 경우에는 5년형이 기다리고 '닥쳐'일 경우에는 10년형이 기다린다. 자~ 무엇을 고르겠는가?
간단하게 두 게임을 비교해봤는데 결과는 같다. 그리고 그 과정상에서 '불어'가 우월전략인 것도 발견해 냈다. 그리고 확장형과 전략형게임이 각각 순차형, 동시형게임에 어울린다는 것 까지 직관적으로 알 수 있을 것이다. 하지만 죄수의 딜레마 게임에서는 확장형게임도 전적으로 순차형 게임이라고 볼 수 없다고 봐야한다. 경기자 2의 입장을 생각해보면 그는 4개의 선택 조건이 있다. 그리고 각각의 서브게임에 맞추어 전략을 선택한다. 그러나 2년형이 될지 무죄방면이 될지 5년형이 될지는 경기자1의 선택에 따른다. 물론 반대로 가정해도 마찬가지다. 즉, 이 경우는 불완전정보의 상황이기 때문에 동시적이기도 하면서 순차적인 성격을 지니게된다.
아까 예시들었던 아파트 시장의 경우에도 어느 건설사이든지 브랜드 전략을 선택하면 안하는 것보다야 좋은 결과가 나온다. 하지만, 전부다 브랜드 전략을 써버리는 경우는 안쓰는 것보다 못한 결과가 나온다. 그러나 한쪽이 브랜드 전략을 쓰기 시작하고 차곡차곡 브랜드 전략을 써버렸으니 상황을 되돌릴 수도 없게 된다. 이처럼 순차게임인 것 처럼 보이지만 결국 선택하는 것은 동시게임과 다를게 없어진다.
그런데 이게 게임이론에 뭐가 중요하냐면, 미국은 대게 대외협상에서 강경책을 편다. 도덕이고 나발이고 간에 일단 이득을 보면 땡이다. ('합리적이다 = 이기려고 용쓴다' 기억하는가?) 2008년 말/2009년 초 팔레스타인 사태를 즈음해서 인도적으로 보이는 오바마 대통령 마저도 아직까지는 안보리에 반대의사를 명확히 표현안하고 있는 것을 보면 미 외교당국은 꽤나 강경한 편이다.
도덕적 비난을 받으면서 왜 그럴까? 미국은 상대가 온건하게 나오건 강경하게 나오건 상관없다. 온건하게 나오면 적대할 이유가 없고 강경하게 나오면 첨단무기로 공격하면 그만이다. 게다가 경제규모가 빵빵해서 무기를 사용해도 크게 타격을 입지도 않는다.
여기서 이 전략을 일단 크게 나누어 보자. 내가 좋은 전략이 있고 내가 하면 안좋은 전략이 있다. 이를 두고 게임이론에서는 우월전략(dominate)과 열등전략(dominated)으로 구분하는데, 우리가 잘 아는 죄수의 딜레마를 통해 보면 좀 더 쉬워진다.
용의자2 | |||
불어 | 닥쳐 | ||
용의자1 | 불어 | 5,5 | 0,10 |
닥쳐 | 10,0 | 2,2 |
전제야 다들 알겠지만, 어느날 두 사람이 금은방 유리창을 깨고 홀딱 털어버리다 잡혔는데, 경찰이 동시에 이 둘을 따로 심문하는 방법을 썼다. 참 잔인하게도 한명이 죄를 시인하고 한명이 죄를 시인하지 않으면 정상참작해서 풀어주고 한쪽에다 다 뒤집어 씌운다고 유혹한다. 둘 다 아무말 안하면 주거침입으로 2년만 살고, 둘 다 시인 하는 경우에는 5년형을 받는다.
여기서 내가 용의자1이고 용의자2가 닥치고 있다면 난 당연히 불어야 한다. 당연하지 불면 무죄방면인데...(여기서 게임이론으로 보는 잔인함?이 드러난다) 용의자2가 불면? 뒤도안보고 불어야 한다. 안그랬다간 10년형이다. 용의자2라면? 마찬가지다 용의자1이 분다면 난 당연히 불어야되고 용의자2가 닥치면 역시 당연히 불어야한다. (합리성 앞에는 의리고 우정이고 없다.)
이렇게 '불어'를 선택하는 것은 상대가 불든 말든 간에 더 좋다. 즉, 더 높은 보수를 받을 수 있다. 그래서 '불어'는 '닥쳐'보다 항상 좋기 때문에 전적으로 우월하다(strictly dominate). 그리고 이걸 강우월전략이라고 부른다. 그리고 '닥쳐'는 '불어'보다 항상 나쁘기 때문에 전적으로 열등하다(strictly dominated). 역시 이는 강열등전략이라 한다.
예를 하나 더 들어 보자, 아파트 회사들이 브랜드화 전략을 쓰면 홍보, 마케팅 비용에 돈이 많이든다. 그래서 아무도 안하는 것이 가장 좋다. 하지만 아파트 회사들이 전체적으로 다 어려워지자 다양한 방법을 모색했는데 이때 대림건설에서는 'e-편한세상'이란 브랜드를 런칭하면서 공격적으로 마케팅을 시작했다. 물론 단기적으로 엄청난 수익을 올렸고 아파트 인지도 부문에서 1위를 일정기간 기록했지만, 삼성 '래미안' 대우건설 '푸르지오' GS '자이' 경남 아너스빌 풍림 아이원, 벽산 블루밍, 현대 아이파크, 신동아 파밀리에..... 아파트 짓는다는 온 건설사는 전부 브랜드화전략을 쓰면서 전체적으로 실질적으로 아파트 시장에는 큰 변화가 없고 거품만 생기고 건설사들은 브랜드 광고때문에 톱모델 쓴다고 돈만 때려박아댔다.
결국 가장 좋은 상태가 있기는 하지만 전체 게임 참가자가 합리적이라면 강우월전략으로 가장 좋은 상태가 되지는 않는다.
이번에는 죄수의 딜레마를 확장형으로 바꿔서 생각해보자. 맨 위에서 부터 시작되고 각 분기점에서 행동을 선택하면 되는데 한명이 고르면 다른 한명이 그 다음에 고른다고 보면 된다. 맨 아래 괄호있는 수는 아까와 마찬가지로 형량으로 앞의 것이 용의자1의 것이고 뒤가 용의자2의 것이다.
여기서 내가 용의자1이고 용의자2가 닥치고 있다면 난 당연히 불어야 한다. 당연하지 불면 무죄방면인데...(여기서 게임이론으로 보는 잔인함?이 드러난다) 용의자2가 불면? 뒤도안보고 불어야 한다. 안그랬다간 10년형이다. 용의자2라면? 마찬가지다 용의자1이 분다면 난 당연히 불어야되고 용의자2가 닥치면 역시 당연히 불어야한다. (합리성 앞에는 의리고 우정이고 없다.)
이렇게 '불어'를 선택하는 것은 상대가 불든 말든 간에 더 좋다. 즉, 더 높은 보수를 받을 수 있다. 그래서 '불어'는 '닥쳐'보다 항상 좋기 때문에 전적으로 우월하다(strictly dominate). 그리고 이걸 강우월전략이라고 부른다. 그리고 '닥쳐'는 '불어'보다 항상 나쁘기 때문에 전적으로 열등하다(strictly dominated). 역시 이는 강열등전략이라 한다.
예를 하나 더 들어 보자, 아파트 회사들이 브랜드화 전략을 쓰면 홍보, 마케팅 비용에 돈이 많이든다. 그래서 아무도 안하는 것이 가장 좋다. 하지만 아파트 회사들이 전체적으로 다 어려워지자 다양한 방법을 모색했는데 이때 대림건설에서는 'e-편한세상'이란 브랜드를 런칭하면서 공격적으로 마케팅을 시작했다. 물론 단기적으로 엄청난 수익을 올렸고 아파트 인지도 부문에서 1위를 일정기간 기록했지만, 삼성 '래미안' 대우건설 '푸르지오' GS '자이' 경남 아너스빌 풍림 아이원, 벽산 블루밍, 현대 아이파크, 신동아 파밀리에..... 아파트 짓는다는 온 건설사는 전부 브랜드화전략을 쓰면서 전체적으로 실질적으로 아파트 시장에는 큰 변화가 없고 거품만 생기고 건설사들은 브랜드 광고때문에 톱모델 쓴다고 돈만 때려박아댔다.
결국 가장 좋은 상태가 있기는 하지만 전체 게임 참가자가 합리적이라면 강우월전략으로 가장 좋은 상태가 되지는 않는다.
이번에는 죄수의 딜레마를 확장형으로 바꿔서 생각해보자. 맨 위에서 부터 시작되고 각 분기점에서 행동을 선택하면 되는데 한명이 고르면 다른 한명이 그 다음에 고른다고 보면 된다. 맨 아래 괄호있는 수는 아까와 마찬가지로 형량으로 앞의 것이 용의자1의 것이고 뒤가 용의자2의 것이다.
여기서는 용어를 잠시 정리하고 가야되는데
각각의 동그라미들은 마디(node)라고 한다. 그리고 시작이 되는 마디는 뿌리(초기점:initial node)라고 하고 맨 아래있는 점들을 종결마디(terminal node)라고 한다. 그리고 한 마디에서 다른 마디로 가기 위한 가지(branch)와 그 마디를 합쳐서 하위게임(subgame)이라고 한다. (참조 : http://plato.standfor.edu/entries/game-theory, 김영세 "게임이론")
용어는 이 정도로 하고 첫번째 분기점(초기점)에서는 용의자1이 선택하고 그 다음에는 용의자2가 선택한다고 하자.
그럼 어떤 방법으로 이걸 풀어야 하나 싶은데 이런 경우에는 거꾸로 가면된다. 이런 방법은 어려운 말로 역진귀납법 또는 Zermelo's argorithm 이라고 불린덴다.
즉 아래에서 부터 출발하면 되는건데, 종결마디에서는 진행이 안되니까 중간의 서브게임부터 봐야한다. 그래서 일단, 3번 마디를 보면 용의자2의 선택은 무죄방면 되느냐 2년형을 사느냐 둘 중 하나이다. 선수는 다 이기려고 용쓰니까 당연히 무죄방면이 되는 '불어'를 선택하게된다. 2번 마디를 보면 5년 형이냐 10년 형이냐 둘 중 하나이므로 당연히 '불어'를 선택한다. 근데 지금 선택한다는 말은 다른건 죽어도 선택 안한다는 소리다. 즉, 종결마디의 두번째것과 네번째 것은 이제 아웃 오브 안중이란 소리다.
그럼 이제 초기점으로 가서 본다면 용의자1에게는 '불어'일 경우에는 5년형이 기다리고 '닥쳐'일 경우에는 10년형이 기다린다. 자~ 무엇을 고르겠는가?
간단하게 두 게임을 비교해봤는데 결과는 같다. 그리고 그 과정상에서 '불어'가 우월전략인 것도 발견해 냈다. 그리고 확장형과 전략형게임이 각각 순차형, 동시형게임에 어울린다는 것 까지 직관적으로 알 수 있을 것이다. 하지만 죄수의 딜레마 게임에서는 확장형게임도 전적으로 순차형 게임이라고 볼 수 없다고 봐야한다. 경기자 2의 입장을 생각해보면 그는 4개의 선택 조건이 있다. 그리고 각각의 서브게임에 맞추어 전략을 선택한다. 그러나 2년형이 될지 무죄방면이 될지 5년형이 될지는 경기자1의 선택에 따른다. 물론 반대로 가정해도 마찬가지다. 즉, 이 경우는 불완전정보의 상황이기 때문에 동시적이기도 하면서 순차적인 성격을 지니게된다.
아까 예시들었던 아파트 시장의 경우에도 어느 건설사이든지 브랜드 전략을 선택하면 안하는 것보다야 좋은 결과가 나온다. 하지만, 전부다 브랜드 전략을 써버리는 경우는 안쓰는 것보다 못한 결과가 나온다. 그러나 한쪽이 브랜드 전략을 쓰기 시작하고 차곡차곡 브랜드 전략을 써버렸으니 상황을 되돌릴 수도 없게 된다. 이처럼 순차게임인 것 처럼 보이지만 결국 선택하는 것은 동시게임과 다를게 없어진다.