<서평> 04. 링크(Linked)

"겉모습에 현혹되지 말고 본질을 바라보라"
"Don't be blinded by appearance but discern the basis"


<bookreview> Linked


 2002년도에 출간했으니 약 20년정도로 상당히 오래된 책이다. 이 책을 선정한 이유는 최근 부쩍 '네트워크', '복잡계', '상호 연결성', '창발적 현상'등에 관심이 많아지고 있었고 그 기초가 되는 이론을 알고 싶어 읽기 시작했다. 전체적인 소감은 약간 아쉬운 감이 있는 책이다. 저자의 직관과 통찰력, 내용, 여러 분야를 오가면서 연구한 내용 등 어느 하나 빠지지 않지만 무엇인가 아쉬운 느낌을 지울 수 없었다. 그 이유를 곰곰이 생각해 보니 최근에 읽은 '스케일' 때문인 것 같다. 내용은 약간 다르나 맥락은 비슷한데 더 방대한 양과 최신 연구 결과를 가지고 쓰여진 책을 읽었다 보니 '링크'는 아무래도 조금 심심한 느낌이 들었다. 또한 번역의 결과도 한 몫 했었다. 오래된 고전이다보니 번역이 매끄럽지 못한 부분이 계속 집중을 방해하였다.
( This is around 20 years old book since it was published at 2002. The reason why I chose this book is because recently I'm really interested in 'Networks', 'Complex system', 'Interconnection', and 'Emergence' and so that I want to know the background knowledge of those concepts. Actually, my feeling of this book is little unsatisfied. Even though this book had writer's intuition, insight, interesting contents, and multi-disciplinary study, It's easy to think unsatisfactory. On reflection of the reason of this feelings, that's because of the book 'Scale' that I read month ago. Those two book share a lot of concepts but the book 'Scale' introduce more advanced and state-of-art study. Also the quality of translation interrupts my focusing.  )

 그럼에도 단연코 명작임은 틀림없다. 기하학에서부터 컴퓨터 공학, 생명공학 나아가 경제학까지 여러 분야를 넘나들며 여러 분야들 속에서 '네트워크'가 어떻게 발견되고 그 공통점이 무엇인지 서술하였다. 그리고 뛰어난 통찰력으로 21세기 과학이 가야 되는 지향점을 제시하였다. 앞서 책 '스케일'과 비슷한 내용이 많다고 했었는데 두 책을 모두 읽어보지 않은 독자의 경우 '스케일'을 읽기에 앞서 '링크'를 먼저 읽어보는 것을 추천드린다. 복잡계가 어떻게 형성되고 어떻게 소통하고 있으며, 그로부터 창발적인 현상이 왜 일어나는지 그 근본 이유를 설명하고 있으며 이를 읽고 나면 '스케일'에서 서술하는 내용을 보다 깊게 이해할 수 있으리라 생각된다. (나도 회독을 해야겠다. '스케일'은 블로그를 시작하기 전에 읽었었는데 회독 후 리뷰를 올려야겠다.)
( In spite of all of that excuses, It is clear that this book is one of the masterpiece. Crossing over the discipline from geometry to computer science, biotechnology, and economics, this book described how 'Networks' covers and bonds those different fields. And his amazing insight sets the milestone of 21st century science. Previously, I mentioned that there is considerable overlap between this book and 'Scale'. If you didn't read both, then I recommend you to read this book first than 'Scale'. This book explains the fundamental reasons that how can the complex systems are developed, and from that why the 'emergence' burst up. After you read 'Linked' then It would help your comprehension of 'Scale' more deeply.(I reckon that I have to read 'Scale' one more time. At that time I didn't start this blog, I don't have any book review. After reading I will update the book review of 'Scale') )


Random networks(left), Scale-free networks(right), Random network는 무작위로 노드가 연결되어 있고 Scale-free network는 'hub' 라고 불리는 특정 노드가 여러 링크를 가지고 있다.
(In the random network each node is randomly connected. But in the scale-free network, some special nodes called 'hub' have most of the link. )
(출처.  left : http://corelab.mae.ufl.edu/people.html , right : https://www.flickr.com/photos/sjcockell/8425835703)

 당시(2000년) 최대 규모의 검색 사이트인 야후를 일시적으로 마비시킨 중학생 일명 마피아 보이(MafiaBoy)의 일화를 소개하며 글은 시작한다. 그 소년이 엄청난 컴퓨터 천재여서 이런 일을 일으킬 수 있었던 것이 아닌 단순히 인터넷 즉, 월드와이드웹의 네트워크가 척도 없는 네트워크의 특징을 가지고 있었기 때문이다. 이 사건은 사람들에게 네트워크 보안의 취약성을 부각시켰으며 전문가들에게는 네트워크 구조 연구의 필요성을 더욱 절실히 느끼게 해주었다.
( This book starts with introducing the story 'MafiaBoy'. At that time(2000 years) one of the biggest internet platform 'Yahoo' was temporary stopped because of middle school age boy. It's not because he is computer genius but the internet in other words 'wold wide web' had properties of a 'scale-free networks'. In the general people, this event alert vulnerability of computer security to general people. And the expert groups felt  the high demands of studying network structure. )

척도 없는 네트워크의 특징은 '허브(Hub)'에 있다. 특정 소수의 노드가 대부분 다른 노드들과 연결되는 링크를 소유하고 있다. 이러한 구조는 인터넷, 대인 관계, 경제, 생태계, 심지어 생물학과 같은 다양한 분야에서 고르게 나타난다.* 척도 없는 네트워크가 가지는 허브는 네트워크 내에서 노드들 사이의 거리를 비약적으로 축소시켜준다. 즉, 네트워크를 '좁은 세상'으로 만든다. 이러한 특징은 허브를 통한 전파가 기하급수적으로 빠르며 반대로 만약 허브들을 제거한다면 네트워크가 빠르게 붕괴할 수 있는 취약점을 나타낸다. 또한 바이러스가 급속도로 사회에 퍼지고 좀처럼 사라지지 않는 이유, 갑자기 하루 만에 세계적인 명성을 가진 스타의 탄생 등의 이유를 설명할 수 있게 해준다.
( Remarkable property of scale-free network is 'Hub' which possesses most of links connected to other nodes. This structure is easily found in the internet, relationships, economic, ecosystem, and even biology fields.* In the scale-free networks, hub dramatically reduces the average distance between individuals. Simply, It makes networks as 'small world'. Because of this property, spreading via hub is geometrically fast, but on the other hand, this also has weakness If somebody eliminate the hub then the network easy to break down. Also, It could explain the reason why how could the virus spreads so quickly and how could be a celebrity in a day. )

 이 후 책에서는 여러 분야에서의 척도 없는 네트워크 연구를 소개하고 어떻게 저자가 연구에 참여하게 되었는지, 그리고 연구 결과가 어떻게 났는지 설명하는 식으로 책이 전개된다. 그 중 흥미로운 분야 3개를 소개하고자 한다.
( After this, the book introduced the study of scale-free network in multi-discipline, how could he joined that study, and what was the result. I will present three interesting examples. )

 첫 번째로 바이러스의 전파 모델이다. 인터넷 속에서 'Love letter for you'라는 제목으로 메일을 보내 바이러스를 몇 분 만에 전세계에 퍼트렸으며, 며칠 내에 백신이 등장했음에도 불구하고 몇 년이 지난 저자가 글을 쓸 당시에도 그 바이러스가 죽지 않고 인터넷 속을 돌아다니고 있었다고 한다. 또한 에이즈의 전파 또한 비슷한 양상을 띤다. 처음은 동성애를 중심으로 퍼졌으나 이제는 전세계에 퍼져있는 상태이다. 이번 코로나 바이러스도 마찬가지다. 초기 한달 간의 방역을 통해 잠잠해지나 싶었으나 한 명의 구멍으로 우리나라의 방역 체계가 무너질 뻔 했었다.
( First, Virus spreading model. It is said that the virus was spreading around the world within minutes of sending an e-mail titled "Love letter for you" on the internet, and it was still alive that time when the author was writing, even though the vaccine appeared in a few days. Spreading of AIDS also has similar aspect. At the first time, it spread through homosexual group, but now everywhere around the world. And it is same as recent Corona virus too. At the begin of month prevention, I thought it would be let up. But one person came close to breaking the our prevention system. )

어떻게 이런 일들이 가능할까? 저자는 척도 없는 네트워크의 특성이라고 설명한다. 기존 네트워크 모델에서는 '임계점'이 있어 '임계점'을 넘지 못하면 바이러스가 금방 사그라드나 척도 없는 네트워크에는 '임계점'이 없다고 한다. 즉, 바이러스는 사라지지 않고 네트워크 내에서 끊임없이 조금씩 돌고 돈다는 뜻이다. 또한 그나마 가장 효과적인 치료는 허브를 중심으로 한 치료인데 이것이 힘든 이유는 누가 허브인지 판단이 어렵다는 점이다. 그러나 허브를 판단하고 막으려는 노력만으로도 바이러스 전파를 크게 억제할 수 있다고 한다.
( How could it be possible? The writer said, this is just one of the characteristics of scale-free network. Previous models had 'threshold' so if the phenomena couldn't over 'threshold' then it finally goes down. But there is no 'threshold' at the scale-free network. So the virus is never disappeared and goes around and around inside the network and the only way to hold the spreading is taking care hub first. But it is hard to recognize which is the hub. Luckily, just trying to figure out hub and to treat it first, works at preventing the spreading.  )

 두 번째로 인터넷 상에서 우리가 접하는 정보가 얼마나 편향 되어있는지에 대한 설명이다. 본문에서 '상반된 견해를 보이는 사이트의 링크를 제공하고 있는 사이트는 단지 15% 밖에 되지 않는다. - 280'고 서술하고 있다. 또한 우리가 주로 정보를 접하는 소스는 우리의 관심사와 비슷한 부류가 모인 일종의 '클러스터'에서 나올 확률이 높다. 즉, 나와 비슷한 생각을 하는 사람들끼리 모여서 상반된 의견을 가진 정보는 거의 교류하지 않은 채 나의 견해를 뒷받침해줄 편향 된 자료만 얻을 확률이 매우 높다는 것이다. 이런 상황이다 보니 마치 전 국민이 나와 비슷한 생각을 하고 있다는 착각마저 할 수 있다. 인터넷 네트워크가 커지고 더욱 복잡하게 연결될 수록 역설적이게 내가 접하는 정보는 매우 편향되 있을 가능성이 높아진다. 이러한 정보는 사고를 경직시키고 나아가 선동 및 세뇌까지 당할 확률이 높다.
( Second, description of that how much we easily take biased information from the internet. At the book, 'Only 15% of internet sites showed contrary site's link. - 280 page.' Also, It is most likely that people who think similar to me will gather together and we don't share any conflicting opinions but just get biased information supporting my point of view. We can have miss thinking that everybody agrees with my idea. Ironically, as networks getting complex and dense it has more possibility that we get more biased information. This information could stiffen our thinking and even easy to instigate or indoctrinate us. )

 세 번째로 우리 몸에 있는 분자들의 네트워크이다. 분자들의 네트워크는 3단계를 생화학 반응을 거치면 모두 연결될 수 있는 매우 좁은 관계에 놓여있다. 이는 한 분자의 변화가 즉각적으로 모든 분자에게 영향을 끼칠 수 있다는 뜻이다. 어쩌면 이러한 연결은 우리가 항상 긍정적으로 생각해야 하며 모든 것에 확신을 가지고 임해야 한다는 점을 반증하는 것이 아닐까? 호텔리어들 대상으로 한 실험에서 그들의 건강 상태가 호텔리어가 하는 일이 실제 엄청난 운동 효과를 가지고 있더라도 인식하지 못하면 신체에 전혀 영향이 없다는 것을 보인 것과 같이 우리 생각이 신체에 실제로 우리가 아는 것보다 더욱 큰 영향을 끼치고 있는지도 모른다.
( Finally, network of our body molecules. This network is really small as it could reach other molecules after only three steps of biochemical reactions. The meaning of this is if the change of one molecule could effect directly to others. Perhaps this might disprove the thing that we always think in positive directions and have to do something with conviction. One hotelier experiment shows even if their works have high exercise effects there is no any effect without cognition. So that the thinking might affect our body more than that we know. )

 저자는 환원주의에서 벗어나 전체를 바라보라고 말하고 있다. 앞서 설명한 분야들은 얼핏보면 서로 매우 동떨어져있는 분야이다. 나 또한 책을 읽으면서 저자의 왕성한 연구활동과 그 범위에 매우 놀랐었다. 그러나 그 껍질을 벗기고 나면 모두 같은 네트워크 특징을 가지고 있고 같은 수학으로 서술 될 수 있다. 우리는 초연결 사회에서 살아가고 있으며 점점 모든것이 연결되고 있다. 이러한 사회에서 즉각적이고 화려한 것에 현혹되지 말고 보다 큰 본질을 볼 수 있는 안목을 기르는 것이 중요하지 않을까?
( Writer said that deviate from the reductionism and look at the whole. At the first glance, previous examples are looks independent fields. While I was reading the book, I was so shocked because of his vigorous studying and broadness of that. However when it peeled out, they have similar network properties and can express same mathematic equations. We are lived in 'Super-connectivity world' and everything is getting connected to each other. In this world, Is it important to develop the perspective that can distinguish basis from superficial things and instant showing?  )

* 사실 이 부분의 설명이 조금 틀렸다. 책이 나온지 18년정도 되다보니 연구가 더욱 진행되었고 급기야 "Scale-free networks are rare"[1] 와 같은 최신 연구결과가 나오기 시작했다. 논문의 내용을 간략히 소개하면 기존 네트워크 연구에서 데이터 수의 부족, 특정한 데이터 셋 사용, 보다 엄밀한 수학적 증명의 부재 등으로 척도 없는 네트워크가 아님에도 척도 없는 네트워크로 피팅 할 수 있었었다. 특히 최근 빅데이터라고 불리우는 분야가 각광받을 정도로 어마어마한 수의 데이터 수집이 가능해졌고 컴퓨팅 능력의 비약적 향상으로 이러한 데이터를 효율적으로 처리할 수 있게 되었다. 그러다 보니 비교적 적은 데이터를 사용하여 피팅 한 결과는 멱급수의 수식이 도출되지만 실제는 멱급수의 그래프와 형태가 유사한 'log-normal', 'stretched exponential'등과 같은 함수로 모델링 했어야 했다. 저자는 최신 통계학을 사용하여 네트워크를 멱급수로 피팅 하였을 때와 그 외 다른 함수로 피팅 하였을 때의 결과를 비교하여 실제 네트워크들이 척도 없는 네트워크와 얼마나 유사 한지를 판단하였다. 그 결과 총 927개의 networks들 중 4% 만이 척도 없는 네트워크로 모델링 할 수 있었다.
( Actually, this is wrong. Because this book was published since 18 years ago, this fields have been studying more deeply and finally the paper "Scale-free networks are rare"[1] is published. Briefly introducing the contents of this paper, Previous studies used small amount of data, specific data sets, less rigorous statistical methods and differing definitions, so that there were miss matching as scale-free networks but actually there were not. Especially, recent day we can be possible to gather bunch of the data so called 'Big data', and process more effectively those because of rapid improvement of computing ability. And, most of the scale-free networks study should've been fitted as alternative non-scale-free networks for example, 'log-normal', or 'stretched exponential' distributions which are similar as power-law in realistic sample sizes. Author used state-of-art statistical techniques to test which are the best model of real system. As the result, only 4% can be explained as scale-free network along 927 networks.  )

Reference
[1] AD Brodio, A Clauset, "Scale-free networks are rare", Nature communications, Vol. 10, 1017, 2019

댓글 쓰기

0 댓글