본문 바로가기
네트워크 사이언스

네트워크 사이언스의 주요한 구조들

by 뭉코원정대 2021. 2. 2.

네트워크 사이언스의 주요한 구조들

 

네트워크 구조는 시스템의 기능, 능력치, 탄력성, 진화와 같은 중요한 정보들을 제공한다. 다시 말하면 우리가 시스템의 세부 요소들에 대해 모두 알지 못한다고 해도 네트워크의 맵핑 (네트워크의 세부 시스템 요소들의 연결)을 아는 것은 시스템에 대한 중요한 질문에 답하기에 충분한 정보가 된다.

 

우리의 목표가 새로운 시스템을 구축하는 것이라면 네트워크 표상으로부터 시작해야한다. 표상 구축이 완료된 후 하위 수준의 디자인을 충원시켜야 한다.

 

 

위 그림은 네트워크 구조의 몇가지 예시들을 보여준다.

 

만약 우리가 네트워크 시스템에 대해 아무것도 모른다면 우리는 그 네트워크의 효율과 탄력성에 대해 어떻게 말할 수 있을까? 6개의 세부요소가 연결된 커뮤니케이션 시스템을 디자인한다고 가정해보자. 첫 질문은 네트워크 구조가 어떻게 되어야 하는가? 이다. 위의 그림은 몇가지 옵션들을 보여준다. 예를 들어, Ring 구조는 모든 노드들 사이의 쌍의 연결을 보여준다. Line, Tree, 그리고 Star 구조는 최소한의 연결을 지니며 만약 특정 노드나 엣지가 연결에 실패한다면 매우 취약하다. 완전하게 연결된 구조를 최대 수의 연결을 필요로 한다. 하지만 이는 매우 탄력적인 (저항에 잘 견디는) 커뮤니케이션을 가능케 한다 Mesh 구조는 모든 요소 사이의 trade-off를 제공한다.

 

 

 

위 그림은 네트워크 사이언스 연구자들의 공동 저자 네트워크를 보여준다. 각 노드는 한 연구자를 나타내며 만약 두 연구자가 한 논문을 공동 출판한다면 두 노드는 하나의 선으로 연결된다.

 

네트워크 사이언스에서 굉장히 중요하게 다루어지는 질문은 주어진 네트워크 표상에서 가장 중요한 모듈 혹은 노드는 무엇인가? 혹은 무엇이 가장 중요한 연결 (혹은 엣지) 인가? 이다. 물론, 이는 “중요”를 어떻게 정의함에 따라 달라진다. 그리고 여기에서 Centrality (중심성) 를 정립하는 몇가지 다른 매트릭스들이 있다. 때때로 우리는 가장 많은 연결을 지니고 있는 노드나 엣지를 가장 중심에 있는 것으로 정의하고자 한다. 또한,제거되었을때 네트워크에 가장 큰 손상을 입히는 노드나 엣지를 가장 중심에 있는 것으로 생각하기도 한다.

 

 

 

예를 들어 위의 그림은 왕자의 게임의 등장인물의 네트워크를 보여주는데, 두 노드는 두 등장인물이 함께 활동할 때 연결되며 연결의 강도는 상호 인물의 상호작용 정도에 따라 결정된다. 위 그림에서 두 개의 다른 중심성 매트릭스가 나타난다. 노드의 크기는 PageRank 라는 이름의 중심성 매트릭스를 참조한다. 이는 구글의 첫 웹 검색 엔진에서 사용된 것과 동일한 매트릭스이다. 노드 V의 값은 V 를 가르키는 다른 노드들에 의해 단순히 결정되는 것이 아니라 PageRank 값이 얼마나 큰지 그리고 얼마나 많은 노드들이 가리키고 있는지에 대해 결정딘다. 두번째 중심성 매트릭스는 Betweenness 라고 불리며 이는 노드 라벨의 크기에 따라 보여진다. 노드 V의 Betweenness centrality는 노드 V를 통과하는 가장 짧은 경로의 갯수에 연관되어있다. 두 매트릭스 모두 Tyrion와 Jon을 가장 중심적인 캐릭터로 분류한다 (비록 둘은 아직 상호작용 한 적이 없음에도).

 

 

 

네트워크 사이언스에서 중요한 또 한가지 점은 상호 연결된 노드들의 군집 (혹은 다른 말로 커뮤니티)를 발견하는 것이다. 동일한 커뮤니티의 노드 간의 연결 밀도는 다른 커뮤니티와의 연결 밀도보다 훨씬 크다. 

다시 왕자의 게임 네트워크로 돌아가서 살펴보면 각 색깔은 다른 커뮤니티를 나타내고 있으며 각기 다른 크기를 지닌 7개의 커뮤니티를 보여준다. 커뮤니티 탐지에는 다양한 알고리즘이 있다.

 

 

 

네트워크 사이언스의 중요한 요소는 네트워크 역동이다. 이는 시간의 흐름에 따라 시스템이 어떻게 자연적으로 진화하는지, 새로운 연결을 구축하는지에 초점을 맞추는 것을 뜻한다. 예를 들어, 뇌의 신경망은 청소년기에 극적으로 변화한다. 또한, 사람들이 새로운 것을 학습할 때 뇌의 연결망이 변화하기도 한다. 예를 들어 위의 그림을 살펴보면, 흰색과 빨간색 커뮤니티는 점진적으로 파란색 네트워크에 흡수된다.

 

 

네트워크 사이언스의 주요한 문제는 네트워크의 역동 과정을 연구하는 것이다. 네트워크의 구조는 동일하게 남아있지만 그 내부의 역동은 점진적으로 변화할 수 있는데 예를 들어, 전염병의 확산과 같은 것들을 생각할 수 있다. H1N1 바이러스는 2009년 멕시코에서 시작되어 주로 항공 운송을 통해 전세계로 빠르게 확산되었다. 네트워크 사이언스를 연구한다면 다음과 같은 질문에 대해 답할 수 있게 된다. 기본 네트워크의 구조가 전염병의 확산에 어떠한 영향을 미치는가? 또한 어떠한 중재가 판데믹을 막을 수 있는지를 시뮬레이션 할 수 있다. 또한 소셜미디어의 네트워크 표상을 통해 가짜 뉴스를 퍼트리는 데 가장 영향력이 있는 선동자를 찾을 수 있다.

 

 

마지막으로 머신 러닝 (Machine Learning, 기계 학습)에 대해 짚고 넘어가자. 머신 러닝은 데이터에 대한 통계적 모델을 생성함으로써 모델을 분류, 군집화, 회귀 등과 같은 작업에 활용하는 것이다. 네트워크 사이언스는 그래프 모델에 집중함으로써 머신 러닝에 기여하고있다. 예를 들면 머신 러닝 모델은 조현병 환자의 유전자들에 대한 네트워크를 구축하고 약들과 유전자들의 알려지지 않은 상호작용들을 미리 예측하는데 사용될 수 있다.

 

 

반응형

댓글