자신을 인식하는 물질, 존재와 의식... 자연철학적 접근

지능의 탄생 본문

도서

지능의 탄생

existence_of_nothing 2021. 4. 5. 08:31

 

- 지능의 탄생 2                    by    이대열

 

1. 개인적 학습

 

동물이나 인간들은 주변 환경에 적응한다. 이러한 적응 과정을 학습이라고 부른다. 동물들은 고전적 학습 (파블로프의 종소리..)법 혹은 기구적 학습법 (미로에 치즈와 꽃을 두면 쥐들은 꽃 주위에 치즈가 있음을 배우고 다음에 꽃을 찾는다)에 따라 학습한다. 동물들은 본능적으로 호기심을 가지고 태어나기에 끊임 없이 주변 환경을 배회하면서 정보를 수집한다. 그 정보는 뇌에 기억되어 있다가 비슷한 상황이 되면 효율적 판단을 하게 만든다. 

 

유전자는 뇌에게 효율적인 복제를 위한 판단 능력을 양보하였다. 존재들이 구조를 이루면 자연스럽게 기능의 분화가 발생한다. RNA는 DNA에게 유전정보 복사, 단백질에게 대사 기능을 양보한다. 미토콘드리아는 자신의 복제 능력을 포기하고 숙주에게 영양분을 공급받아서 ATP 밧데리를 충전해서 공급하면서 자신도 살아간다. 세포는 뇌에게 판단의 기능을 양보하고 대뇌는 다시 기능적으로 분화하여 전두엽, 측두엽, 후두엽 등으로 분화한다.

 

뇌에서 도파민이 분비된다. 도파민이 뇌에 퍼지면 기분이 좋아지고 이러한 방향으로 행동한다. 결과가 좋으면 그 행동을 반복한다가 손다이크의 "결과의 법칙(law of effect)"이다. 최종결과가 우리가 원하는 방향, 바둑에서의 승리, 으로 이끌기 위한 전략을 학습하는 것을 강화학습 (reinforcement learning)이라고 한다. 학습의 결과는 뇌의 시냅스의 연결강도의 형태로 저장되고, 장기 기억이 필요한 경우에는 새로운 시냅스를 생성한다. 시냅스의 연결 강도의 변화를 시냅스 가소성이라고 하며, 나이가 듦에 따라 뇌의 가소성이 떨어진다.

 

나의 자아는 사실 나의 기억이기도 하다. 기억이 사라지면 자아도 사라지고 행동은 단순히 자극에만 반응할 뿐이다. 치매에 걸리면 같은 말을 반복한다. 그러면 도대체 우리가 기억해야 할 내용은 뇌의 어느 부분에 어떻게 저장되는가? 에릭 켄달이 평생을 쫓아다녔지만 아직도 정확히 모르는 기억저장장소 "엔그램, engram", 신경과학자들의 성배이다.

 

기억에는 서술적 기억과 절차적 기억이 있다. 서술적 기억에는 다시 일화기억(어제 무얼 먹었지?)과 의미기억(프랑스 수도는?)이 있다. 서술적 기억은 (기억한 내용의) 설명이 가능한 기억, 절차적 기억은 자전가 타기와 같이 체화된 기억이다. 서술적 기억은 해마(hipocampus)를 거쳐서 대뇌피질 전체에 기억된다. 절차적 기억은 해마와 상관없다. 

 

H. M (Henry Molaison)이라는 환자의 간질을 치료하기 위하여 해마를 제거한다. 수술은 성공적이고 발작은 줄어들지만, 부작용으로 이전 기억은 남아 있지만 수술이후의 일은 전혀 기억못한다. HM도 절차적 기억에는 문제가 없다 (절차적 기억은 기저핵(basal ganglia)에서 이루어지는 것으로 추측한다). 재미있는 것은 우리는 HM이 불행할거라고 생각하지만 정작 본인은 편안하게 살다 간다. 우리에게 생각의 적음이 문제가 아니라 너무 많은 생각이 문제인 것이다.

 

재미있는 것은 도파민은 보상(결과)의 대소가 아니라 예측 오차에 비례해서 주어진다는 것이다. 원숭이에게 바나나 2개를 주다가 3개를 주면.. 바나나 4개를 주다가 3개를 주는 것 대비 도파민 분비가 더 활발하다. "후회"란 자신이 기대한 결과보다 못한 결과가 나온 경우, 즉 예측 오차가 음의 경우에 느끼는 감정이고 다음에는 후회하지 않을 행동을 한다. 원숭이도 가위바위보에서 보를 내고 진 경우에, 다음에는 주먹을 내는 경우가 많다. 동물들도 후회를 한다는 것이다.

 

=========================================================

 

2. 게임이론

 

게임이론 (game theory)은 여러명이 게임에 참여할 때, 나에게 가장 유리한 전략은 무엇인가에 관한 이론이다. 폰노이만이 이론을 만들고 오스카 모르겐스테른이 경제 분야에 게임이론을 적용한다. 폰노이만은 최악의 손실을 최소로 하는 minmax 알고리즘을 개발하고, 제로섬게임에 이를 적용한다. 1950년에 존내시(뷰티풀마인드)는 22살의 나이에 non zerosum게임에서도 최적의 해가 존재한다는 Nash 균형이론을 만들고 나중에 이 공로로 노벨상을 수상한다.  

 

정의란 무엇인가에서 롤스가 게임이론으로 정의를 설명하는 부분도 있다. 이대열 교수는 죄수의 딜레마 문제를 소개한다. 죄수의 딜레마라는 용어와 의미는 알지만, 정확한 예로 죄수의 딜레마를 설명하라면 잘 못하시는 분들이 많다. 다음 문제를 생각해 보자.

 

범죄를 저지른 두명을 심리한다. 만약 두사람 모두가 자백하면 3년으로 선처한다. 만약 두사람 모두 부인하면 책임소재가 불명확하여 모두 1년, 만약 1명은 자백하고 나머지가 부인하면 전자는 무죄 ... 후자는 괘씸죄로 5년형이다. 최선의 전략은 무엇인가?

 

A의 입장이다. 만약 B가 부인하고 A도 부인하면 1년, A가 자백하면 무죄.. 이때는 자백하는 것이 유리하다. 만약 B가 자백하고 A도 자백하면 1년, A가 부인하면 5년.. 이때에도 자백하는 것이 유리하다. 두 경우 모두 자백하는 것이 유리하므로 A는 자백하는 것이 최선의 전략이다. B도 마찬가지이다.

 

두 사람 모두 최선을 다하였지만, 결과는 최적의 해인 둘다 부인하는 것보다 못하다. 이것이 죄수의 딜레마이다. 인간들은 모두 자신의 입장에서 최선을 다하려고 하기 때문에.. 사회 전체적으로는 마이너스가 되는 일들을 종종 벌인다.

 

게임이론은 모든 사람들이 합리적 판단을 한다는 전제하에서 인간들의 행동을 분석하는 이론이다. 그러나 실제로 실험을 해 보면 협동을 선택하는 비율이 50% 정도나 된다고 한다. 즉, 인간들은 다행스럽게도... 혹은 어리석게도... 게임이론대로 행동하지 않으며 협동을 선택하는 경우가 많다. 이것은 타인에 대한 믿음일 수도 있고, 좀 더 형량을 줄이려는 도박, 과욕일 수도 있다. 

 

=========================================================

 

3. 사회적 학습

 

네안데르탈인은 인간보다 10%큰 뇌와 단단한 근육을 가졌다. 도구도 사용할 줄 알았던 그들은 수천년 사이에 멸종하였고 지금은 사피엔스종이 지구를 지배하고 있다. 여러가지 학설들이 있지만, 그 큰 이유는 종족의 크기, 그들 사이의 협동력에서 찾는 경우가 많다. 사피엔스들은 사회적 학습을 통해서 그 힘을 키웠다.

 

죄수의 딜레마는 1회성 문제이다. 이제 죄수의 딜레마를 여러번 실험을 해보자.. 그러면 상대방의 패턴에 대해서 어느정도 인지를 했을 것이다. 이것을 반복적 죄수의 딜레마라고 부르며, 이 부분은 아직 완벽한 (해석적) 이론이 없다.

 

1980년에 로버트 액설로드는 여러번 죄수의 딜레마를 컴퓨터 시뮬레이션으로 진행하여 어떻게 행동한 경우에 (전체적으로 ) 가장 높은 점수를 얻었는지 실험한다. 그 전략은 아나톨 레포포트가 제안한 맞대응(tit-for-tat)전략이다. 첫번째에는 협동을 선택한 후에 두번째 부터는 상대방의 선택을 되풀이하는 전략이다. 상대가 배신하면 나도 배신하고 상대가 협조하면 나도 협조한다. 

 

두번재 전략은 파블로프 전략이다. 이 전략에서는 만약 상대가 협조를 하면 나는 이전 전략을 유지하고 변절하면 나의 전략을 바꾼다. 맞대응하는 두 상대가 만나면 둘다 협조하거나 둘다 배신하는 상태에 머물지만, 파블로프 전략가 둘이 만나면 협력의 상태로 수렴한다. 그러나 항상 배신하는 상대를 만나면 파블로프 전략은 배신과 협력을 교대로 하면서 맞대응 전략 대비 손해를 본다.

 

왜 인간들은 이타적인 행동을 하는가? 이타적인 행동이 사회 전체적으로는 이기적인 행동보다 도움이 되기 때문이며, 타인에 대한 믿음이 있기 때문이다. 즉, 내가 협조하면 언젠가 그 사람도 나에게 협조한다는 믿음이 있기 때문이다. 만약, 서로가 서로를 위하여 협조한다면 우리는 죄수의 딜레마를 극복하고 최선의 사회를 이룩할 수 있을 것이다. 그러나, 만약 우리 중에 배신자가 있다면... 그러면 결국은 죄수의 딜레마에 빠질 수 밖에 없을 것이다.

 

====================================================

 

4. 복수

 

복수는 나에게 큰 도움이 되는 행동은 아니다. 복수를 해서 내가 직접적으로 보는 이득이 별로 없고, 복수는 상대방에게 또다른 복수를 야기하기 때문이다. 그런데 왜 인간 혹은 동물들은 복수를 하는가?

 

지능이 발전함에 따라 파블로프 전략, 즉 상대방이 협조하면 나도 협조하는 쪽으로 진화한다. 그러나, 이 경우 상대방이 배신하는 경우에 댓가가 크다. 배신자를 처벌하는데에 비용을 지불하는 것이 협조하는 경우에 보상을 하는 것보다 비용이 적게 든다. 협조는 다수 발생하는데 비해 배신은 빈도가 낮기 때문이다. 따라서, 집단은 비용이 적게드는, 배신자를 처벌하는 방향을 선택한다.

 

====================================================

 

5. 공유지의 비극

 

공유지의 비극이라는 유명한 문제가 있다. 미국 생태학자 게릿 하든이 사이언스지에 실은 간단한 내용인데 빅히트를 친다. "1000마리의 소를 키우는 마을에 1000마리의 소를 먹일수 있는 공유지가 있다. 공유지 사용 비용은 공짜이기에 모두 그곳을 사용하면 공유지는 사라지고 모두에게 손해가 발생한다" 

 

와이파이가 공짜라고 무한 업로드를 하면 모두가 손해를 본다. "무임 승차자의 문제"라고 한다. 공유지의 비극을 해결하기 위하여 "공공재 게임"이론이 생겨났다. 공공재 게임은 다음과 같다. 다른 글에서 퍼온 부분이다.

 

"4명이 게임에 참가하고 1000원씩 주었을 경우, 모든 참가자가 300원씩 기부한다면 총액 1200원의 2배인 2400원을 4명에게 600원씩 똑같이 분배하기 때문에 참가자는 수중에 있는 700원과 합쳐 1300원을 갖게 된다. 참가자에게 가장 매력적인 전략은 한 푼도 기부하지 않고 공동 기부금에서 자기 몫을 챙기는 이른바 무임승차이다.

 

물론 참가자 전원이 무임승차의 유혹을 뿌리치지 못한다면 공동 출자된 돈을 두 배로 불려 배분받는 혜택을 누리지 못하기 때문에 처음 받은 돈만 가질 수밖에 없게 된다. 공공재 게임은 공동의 이익을 위해 노력하면 개인에게 돌아가는 혜택이 있지만 무임승차를 해서 다른 사람이 희생하기만을 바란다면 손해라는 교훈을 함축하고 있다."

 

더 얘기가 길어질 것 같아서 요기서 멈춤...  책은 비추함다.. 지겨움..

 

 

 

반응형

'도서' 카테고리의 다른 글

그리스인 조르바  (0) 2021.04.06
기억의 비밀  (0) 2021.04.05
이강영 - LHC  (0) 2021.04.03
움베르트 에코 - 장미의 이름  (0) 2021.04.03
밀란 쿤데라 - 참을 수 없는 존재의 가벼움  (0) 2021.04.02
Comments