본문 바로가기
STUDY FOR ME/데이터 마케팅

네트워크 분석 기법

by ooook 2022. 5. 23.
728x90

Network Analysis 방법 참고하기

https://brunch.co.kr/@gimmesilver/46

 

네트워크 분석 기법을 활용한 게임 데이터 분석 #1

네트워크 분석 개론 | 이 글은 R User Conference in Korea 2018에서 발표한 내용 및 시간 관계 상 생략한 내용을 정리한 글입니다. 발표 자료는 http://ruck2018.r-kor.org/info/ 에서 확인하실 수 있습니다. 0.

brunch.co.kr

 

https://danbi-ncsoft.github.io/works/2018/11/12/network_analysis-2.html

 

네트워크 분석기법을 활용한 게임 데이터 분석 #2

 

danbi-ncsoft.github.io

 

주요 네트워크 분석 기법

    네트워크 분석 기법은 크게 1) 노드 중요도 (node centrality) 측정, 2) 네트워크 구조 추정, 3) 커뮤니티 탐지로 나눌 수 있습니다. 

 

2.1. 노드 중요도 측정 

    노드 중요도를 측정한다는 것은 '네트워크 구조를 고려했을 때 각 노드들이 얼마나 중요한 위치에 있는지를 정량화하는 것'을 말합니다. 예를 들어 어떤 도시에 기차역과 역 사이에 놓인 기차길이 <그림5>와 같이 생겼다고 가정해보죠. 이런 구조의 기차 노선에서 가장 중요한 기차역 (노드) 은 무엇이며 각 기차역의 중요도를 정량적으로 측정하려면 어떻게 해야 할까요?  

그림 5. 기차 노선을 네트워크 구조로 시각화한 예시

A. Degree centrality

    우선 가장 쉽게 할 수 있는 것은 각 역이 다른 역과 얼마나 많이 연결되어 있는지 그 횟수를 세어 중요도를 측정하는 방법입니다. 이걸 'degree centrality' 라고 부릅니다. 그리고 이렇게 하면 <그림5>에서는 j 가 가장 중요한 기차역이 됩니다. 이 역은 인접한 기차역이 일곱 개로 가장 많기 때문이죠. 

    그런데 한번 j 역을 폐쇄한다고 생각해보죠. 가장 중요한 기차역이니 교통 대란이 발생할 것 같은데, 자세히 보면 해당 역을 이용하던 사람들은 불편할 수 있겠지만 다른 역끼리는 대체 경로가 있기 때문에 (다소 돌아가는 번거로움은 있더라도) 이동하는데 크게 지장이 없습니다. 

 

B. Betweenness centrality

    그런데 만약 h 역을 폐쇄하면 어떻게 될까요? 이제 h 역을 기준으로 왼쪽에 위치한 지역과 오른쪽에 위치한 지역은 서로 왕래가 불가능합니다. 왜냐하면 양쪽을 오고가려면 h 역을 만드시 통과해야 하기 때문이죠. 따라서 교통 흐름의 관점에서 보면 (비록 직접 연결된 기차역의 수는 적지만) h 노드가 가장 중요한 노드가 됩니다. 이렇게 노드 간의 흐름을 고려하여 중요도를 측정하는 방식을 'betweenness centrality' 라고 부릅니다. 

 

C. Closeness centrality

    한편 p 역은 접근성 면에서 가장 좋습니다. 다시 말해 만약 기차역 간에 거리가 동일하다고 가정하면, 어떤 지역에서든지 p 로 갈 때 걸리는 시간이 평균적으로 가장 짧습니다. 이렇게 접근성 측면에서 노드의 중요도를 측정할 수도 있는데 이런 방식을 'closeness centrality' 라고 부릅니다. 

 

D. Eigenvector centrality

    그런데 단순히 가장 거리가 가깝다고 다 좋은 것은 아니겠죠? 우리 나라에서도 단순히 물리적인 거리로만 보자면 충청도가 가장 중앙에 위치하지만, 대부분의 인프라나 사람들은 경기도에 몰려 있기 때문에 충청도에 산다고 해서 가장 편한 것은 아닙니다. 

    마찬가지로 위 그림에서도 단순히 거리만 따지기 보다는 각 기차역의 이용객 수나 기차역 근처 지역의 특성 등을 고려하여 접근성을 따지는 것이 더 합리적일 수 있습니다. 이렇게 각 노드별 가중치를 고려하여 중요도를 측정하는 방식을 'eigenvector centrality' 라고 부릅니다. 

 

    노드의 중요도를 측정하는 방법은 어떤 측면에서 바라볼 것이냐에 따라 이처럼 다양합니다 (여기 소개한 것 외에도 중요도 측정 방식은 많이 있습니다). 따라서 목적에 따라 적절한 방법을 사용해야 합니다. 보통 제 경우에는 한가지 방법만 사용하기 보다는 위에서 소개한 방법 중 몇 가지를 함께 활용합니다. 

 

   따라서 네트워크 구조를 파악하려면 단순히 생김새를 눈으로 보고 판단할 것이 아니라 네트워크 구조를 정량적으로 측정해주는 기법을 사용해야 합니다. 그런데 네트워크 구조 역시 노드 중요도를 구할 때처럼 어떤 것을 중점적으로 볼 것이냐에 따라 여러 가지 측정 방식이 있습니다. 제가 주로 사용하는 기법 중 몇 가지를 소개하면 다음과 같습니다.

 

A. Radius

    Radius는 우리말로 하면 '반지름' 입니다. 반지름이란 원의 중심에서 표면까지의 최단 거리를 의미하죠. 이와 비슷하게 네트워크의 반지름이란 closeness centrality 가 가장 높은 노드에서 가장 먼 노드까지의 최단 거리를 의미합니다. 예를 들어 <그림7>에서 왼쪽 네트워크는 여러 개의 노드가 일렬로 쭉 늘어서 있는 구조입니다. 따라서 이런 경우에는 중앙에 있는 노드가 closeness centrality가 가장 높은데, 여기서 가장 끝단에 있는 노드까지의 거리는 전체 노드 개수의 절반인 11이 됩니다. 반면 오른쪽 네트워크는 마치 회사 조직도처럼 계층적인 구조를 갖고 있어서 가장 상위에 위치한 노드가 가장 높은 closeness centrality 를 갖습니다. 그리고 이 노드에서 단 2단계만 거치면 말단 노드까지 도달합니다. 따라서 이 네트워크는 노드의 개수가 왼쪽보다 더 많음에도 불구하고 radius는 훨씬 작은 2에 불과합니다. 이렇게 네트워크의 노드 개수와 radius의 관계를 이용하면 네트워크 구조가 어떻게 되는지 대략적으로 가늠할 수 있습니다.  

그림 7. Radius가 큰 네트워크(왼쪽)와 작은 네트워크(오른쪽) 예시

 

B. Clustering coefficient

    클러스터링 계수는 쉽게 말해 '나의 서로 다른 두 친구가 서로 친구일 확률' 입니다. 즉, 어떤 노드와 연결된 노드들 중에 임의로 두 개를 골랐을 때 이 두 노드도 서로 연결되어 있을 확률입니다. 네트워크 이론에서는 어떤 세 개의 노드가 서로 연결되어 있는 구조를 'clique'라고 부릅니다 (<그림8>의 오른쪽). 그래서 어떤 네트워크에서 모든 노드가 완전히 연결되어 있다고 할 때 나올 수 있는 clique 개수 대비 실제 네트워크 구조에 있는 clique 개수의 비율을 구하면 클러스터링 계수가 됩니다. 

    

그림 8. 클러스터링 계수와 클리크

 

    예를 들어 <그림9>의 두 네트워크 중에서 왼쪽에 있는 것은 한눈에 봐도 clique가 하나도 없죠? 따라서 이 그래프의 클러스터링 계수는 0입니다. 반면 오른쪽 네트워크는 많은 clique를 갖고 있기 때문에 1에 가까운 클러스터링 계수를 갖습니다. 결국 클러스터링 계수를 측정하면 네트워크가 얼마나 많은 clique를 갖고 있는 구조인지 알 수 있습니다. 

그림 9. 클러스터링 계수가 낮은 네트워크(왼쪽)와 높은 네트워크(오른쪽) 예시

 

C. Degree assortativity

    마지막으로 제가 종종 사용하는 기법은 degree assortativity 입니다. 이것은 서로 연결된 노드쌍에 대해서 각 노드의 degree 에 대한 상관관계를 측정한 값입니다. 쉽게 말해 degree가 높은 노드끼리 서로 연결되고, degree가 낮은 노드끼리 서로 연결되는 경향이 얼마나 강한지를 측정한 수치인데, 상관계수이기 때문에 -1 에서 1 사이의 값을 갖습니다. 

    예를 들어 <그림10>의 왼쪽 네트워크는 가운데 있는 노드가 나머지 대부분의 노드와 연결된 형태입니다. 따라서 가운데 노드는 degree centrality가 굉장히 높은 반면 이 노드와 연결된 나머지 노드들은 degree centrality가 1에 불과하죠. 따라서 이렇게 서로 상반된 노드끼리 연결된 구조를 갖는 네트워크는 degree assortativity가 -1에 가깝습니다. 

    반면, 오른쪽 네트워크는 degree centrality 가 같은 노드끼리 서로 연결되어 있는 경향이 강합니다. 따라서 이런 네트워크의 degree assortativity 를 측정하면 1에 가까운 값을 갖습니다. 

그림 10. degree assortativity가 낮은 네트워크(왼쪽)와 높은 네트워크(오른쪽) 예시

 

2.3. Community detection

    마지막으로 소개할 기법은 '커뮤니티 탐지' 입니다. 이것은 쉽게 말해 전체 네트워크를 연결 밀도가 상대적으로 높은 소집단끼리 묶는 것을 말합니다. 네트워크 이론에서는 이렇게 다른 집단에 비해 상대적으로 연결 밀도가 높은 노드 집단을 'community'라고 부릅니다. 그래서 전체 네트워크에서 이런 노드 집단들을 찾는 기법을 '커뮤니티 탐지' 라고 부르죠. <그림 11>은 하나의 네트워크 구조를 세 개의 커뮤니티로 구분한 예입니다. 

그림 11. 커뮤니티 탐지 예시

   

 만약 분석하고자 하는 네트워크의 규모가 커서 분석해야 할 노드 개수가 많고 구조도 복잡할 때는 이렇게 커뮤니티 탐지 기법을 이용해 좀 더 작은 여러 개의 소집단으로 묶은 후 커뮤니티 단위로 분석하는 것이 좋을 때가 많습니다. 

더 나아가 각 커뮤니티의 구조 및 각 커뮤니티에 속한 노드들의 평균적인 특징을 구해 커뮤니티 간의 차이를 분석할 경우 전체 구조에서는 발견하기 힘든 여러 가지 정보를 얻을 수 있기 때문에 커뮤니티 탐지 기법은 잘 알아 두시면 많은 도움이 됩니다.  

    참고로 커뮤니티 탐지 알고리즘은 다양한 종류가 있습니다. 당연히 각각의 장단점이 있을텐데, 저는 Clauset 등이 2004년에 발표한 알고리즘 (https://arxiv.org/abs/cond-mat/0408187) 을 가장 많이 사용합니다. 속도도 빠르고 커뮤니티 분류도 잘 되며 동일한 네트워크에 대해서는 항상 동일한 결과를 내주는데, 심지어 igraph 라는 라이브러리에서 이 알고리즘을 제공하기 때문에 편하게 쓸 수 있습니다. 게다가 igraph 는 무려 파이썬과 R과 C를 지원합니다!

 

 

 


 

IBM으로 스타필드 데이터 돌려보기

 

  • 카테고리 구성

-> 거품형, 의사결정 

 

 

  • 카테고리별 가격 지출

 

 

고객별 경로

경로 파악해서 경로간의 특이점

이를 위해서 가계 위치 데이터

 

높은 층인데도 매출인 큰 가게 찾아내기

 

 

 

 

 

 


 

 

 

강점을 줄 부분은 평점 갯수 가격

반복행 반복열 스타일별로 가시화 (과정)  -> 잘 안씀

 

 

 

스타필드 데이터 => 매출을 올리는 전략

얼마 예측, 어디서, 어떻게 왜 몇 % 상승될 것인지

 

데이터와 연관하여 검증가능하냐

논리가 데이터에서 뒷받침해주냐

어떻게 해서든 분석해서 가설이 맞다는 것을 검증

 

해당점포가 몇층에 있는지 => 동선

1층이 제일 비싸고 4층이 제일쌈

4층은 영화관은 볼려면 어쩔 수 없지, 4층에 있어도 사람 많은 경우

플로우가 고객의 동선, 고객의 노력지수를 가져옴

원래는 층수가 높을수록 매출이 낮은데, 다른 것이 있다면 확인 

 

기사를 찾아서 세일을 했는지 이벤트가 있었는지 날짜에 맞춰서 이유를 찾아야함

연예인한테 포스팅

어느시간에 붐비는 지 데이터를 확인해서 지하상권을 옮기던가

지하1층에 있는 이마트 트레이더스 광고는 5층 맘카페에 해야해

 

총미세먼지가 높은데 맑은 날도 있음

데이터의 미세먼지에 예민한지 시각적인 미세먼지에 의해 영향을 받는지

 

 

네트워크 가운데로 들어오는 것이 카페, 밖으로 나가는 것은 패션

의류 매장 앞에 카페

방문수가 매출이니 엄청 비싸지 않은 의류브랜드는 앞에 노출

프리퀀시가 높은

패션업계 층에는 음식물싫어…그런데 아르켓은 ok

대규모에서 머신러닝을 돌리는 것은 마케팅적인 의미가 없음

언제 브랜드가 소비되는가 그전에 쿠폰을 뿌려야해요

 

 

 

 


 

 

 

#반려동물

 

내 복합쇼핑몰 최초로 반려동물의 출입을 허용한 스타필드는 다양한 ‘펫 프렌들리’ 정책으로 반려동물 동반 고객에게 큰 호응을 얻고 있다. 특히, 지역 밀착형 라이프스타일센터 스타필드 시티는 스타가든 내 음수대, 배변장 등 편의시설을 갖춘 펫파크를 조성해 고객들이 부담 없이 반려견과의 산책을 즐길 수 있도록 했다.

 

앤드테라스, 도심 속 녹색 정원 연출해 파주·고양서 인증 샷 명소로 인기
펫 프렌들리 쇼핑테마파크 스타필드 하남에 도심 속 녹색 정원을 품은 플랜테리어 카페 ‘앤드테라스(AND TERRACE)’ 5호점이 문을 연다고 전했다.

앤드테라스 5호점은 스타필드 하남에 새롭게 들어서는 펫 프렌들리 카페로, 반려견과 뛰놀며 갓 만든 베이커리와 브런치를 즐길 수 있어 가정의 달 5월을 맞아 반려동물과의 나들이를 계획하는 고객들에게 제격이다.

경기도 파주시와 고양시에서 SNS 포토 스팟으로 각광받는 앤드테라스가 동남권에 오픈한 것은 이번 스타필드 하남점이 처음이다. 널찍한 창으로 쏟아지는 햇볕과 갖가지 식물이 어우러진 울창한 플랜테리어가 특징으로, 도심 속 정원을 연상케 하는 카페에서 녹색 자연이 주는 안정감을 느끼며 커피 한 잔의 여유와 햇살 아래 힐링을 만끽할 수 있다. 매일 굽는 베이커리 40여 종과 테라스 플래터, 에그 베네딕트, 프렌치 랙 등 신선한 재료로 만든 브런치 메뉴도 앤드테라스의 자랑이다.

출처 : The Korea Post(http://www.koreapost.com)

 

#레스토랑

 

프리미엄 다이닝 레스토랑 ‘아웃백 스테이크하우스’(이하 아웃백)가 bhc그룹에 인수된 후 지난 13일 첫 점포 ‘하남 스타필드점’을 열었다. 이 매장은 개점과 동시에 인기 매장으로 떠오르고 있다.

bhc그룹은 “하남 스타필드점이 오픈 당일 점심과 저녁 시간에 예약 고객과 방문 고객으로 빈 좌석을 찾을 수 없을 정도로 인기 매장으로 급부상하고 있다”며 “크리스마스와 연말을 맞아 가족 모임을 위한 예약 문의나 예약 건수가 증가하고 있다”고 14일 밝혔다.

 

프리미엄 다이닝 레스토랑 ‘아웃백 스테이크하우스’(이하 아웃백)가 bhc그룹에 인수된 후 지난 13일 첫 점포 ‘하남 스타필드점’을 열었다. 이 매장은 개점과 동시에 인기 매장으로 떠오르고 있다.

bhc그룹은 “하남 스타필드점이 오픈 당일 점심과 저녁 시간에 예약 고객과 방문 고객으로 빈 좌석을 찾을 수 없을 정도로 인기 매장으로 급부상하고 있다”며 “크리스마스와 연말을 맞아 가족 모임을 위한 예약 문의나 예약 건수가 증가하고 있다”고 14일 밝혔다.


하남 스타필드점은 아웃백의 10번째 와인 특화 매장으로 240석을 갖춘 아웃백 와인 특화 매장 중 최대 규모를 자랑한다.

매장 입구에는 대형 투명 와인셀러가 비치돼 있다. 벽면과 천장 등 곳곳에 아웃백의 정체성이 돋보이는 아트웍 인테리어가 고객들에게 볼거리를 선사한다. 와인 주문 시 이용할 수 있는 좌석은 전용 테이블 세팅으로 와인 특화 매장만의 프리미엄 분위기를 전달한다.

아웃백은 늘어나는 와인 소비 수요에 발맞춰 접근성이 좋은 백화점 및 대형 아울렛을 중심으로 와인 특화 매장을 연이어 선보이고 있다. 와인 특화 매장은 와인 제품 구색 강화, 디캔팅 서비스 제공 등 차별화된 서비스를 선보이고 있다.

 

#문화전시

 

국내 미술계 거장들이 참여한 메타버스 하이브리드 전시회 ‘Amulet 호령전 범을 깨우다’가 전날 개막했다. 강형구, 이이남, 박대성 작가와 함께 ‘아트테이너(예술 활동하는 연예인)’로 주가를 올리고 있는 구준엽(가수), 김규리(배우) 등 예술가 38명이 참여한 메타버스 특별 전시회다. 멈춰있던 작품이 메타버스에 올라타 움직이면서, 이색적인 전시회가 펼쳐졌다.

 

 

#스포츠

 

신세계백화점 스타필드 하남점 2층에 위치한 가민 매장은 골프를 메인 테마로 꾸며져 있으며, 골프용 스마트워치를 중점으로 선보인다.

 

가민 골프 제품에는 전세계 4만1천여개 이상의 코스 맵이 내장돼 있어 국내 라운딩 뿐만 아니라 해외 라운딩에도 유용하게 활용할 수 있다. 또 오르막과 내리막의 경사를 자동으로 감지해 보정거리를 알려주는 '플레이스라이크 디스턴트' 기능, 코스 맵에서 해저드의 위치 및 현재 위치로부터 해저드까지의 거리를 알려주는 '해저드 뷰' 등 코스 공략을 위한 다양한 기능을 지원한다.

하남 스타필드점에는 가민 골프 전체 라인업 외에도 ▲러닝에 특화된 '포러너' 시리즈 ▲스쿠버다이버 및 프리다이버의 안전한 수중 액티비티를 위한 '디센트' 시리즈 ▲사이클링 라인업인 '엣지' 시리즈 ▲강인한 아웃도어 스마트워치 '인스팅트' 시리즈 ▲데일리 피트니스 스마트워치 '베뉴' 시리즈 ▲데일리 패션 스마트워치 '비보무브' 시리즈 등 다양한 스마트워치를 전시 및 판매한다.

 

 

#부동산

 

스타필드는 쇼핑, 레저, 미식, 엔터테인먼트까지 맞춤형 쇼핑을 할 수 있는 곳으로 국내 최초 반려동물 동반 쇼핑몰로 주목을 끌기도 했다.

스타필드는 대형 복합쇼핑몰로 역할도 크지만, 지역 가치를 동반 상승시킨다는 면에서 타쇼핑몰과는 다른 의미가 있다.

하남 스타필드 인근 ‘하남유니온시티 에일린의뜰’은 2015년 평당 1천271만 원으로 분양됐으나 스타필드 오픈 후 2018년 8월에 84㎡가 7억5천만 원에 거래가 돼 평당 1천만 원 가량 상승 했다.

올해는 11억 원이 넘는 거래가 지속되고 있어 평당 분양가의 3배가량의 상승을 보였다.

‘스타필드 효과’는 오픈 직후에만 작용한게 아니라 5년 동안 지속적으로 주변 집값을 상승시키고 있는 것이다.

https://www.sedaily.com/NewsView/2664C33FN3

 

레이크필드 운정 위버젠, 선착순 분양

사진. '레이크필드 운정 위버젠' 조감도‘스타필드’가 들어선 하남, 위례, 고양 등이 ‘핫플레이스’로 자리잡으면서 일대 부동산 시장이 요동치고 있다. 인근 지역 거주민들이 즐길 수 있는

www.sedaily.com

 

 



‘스타필드’가 들어선 하남, 위례, 고양 등이 ‘핫플레이스’로 자리잡으면서 일대 부동산 시장이 요동치고 있다. 인근 지역 거주민들이 즐길 수 있는 쇼핑, 식사, 영화, 게임, 스포츠 등의 복합적인 공간이 마련돼 원스톱 라이프가 가능해지면 서다.

스티필드가 입점한 이후 주변 주거단지들의 몸값이 뛰기도 했다. 스타필드 개점이 대형 호재로 작용하면서 지역 부동산가치가 성장했기 때문으로 풀이된다.

이러한 와중에 스타필드의 수혜가 기대되는 단지 ‘레이크필드 운정 위버젠’의 선착순 분양소식이 알려져 대중들의 관심을 한 몸에 받고 있다. 단지는 경기도 파주시 와동동 일원에 지하 1층~지상 27층, 전용면적 83A/83B㎡ 총 164실 규모로 건립된다.

‘레이크필드 운정 위버젠’의 입주민들은 도보권에 스타필드 빌리지가 오픈하면서 ‘원스톱 라이프’를 누릴 전망이다. 스타필드는 일반적인 대규모쇼핑몰과 달리 쇼핑뿐만 아니라 문화·여가생활 등을 함께 영위할 수 있는 복합공간으로 꾸며진다.

스타필드 빌리지 내에는 가족단위 방문객이 취미생활을 즐길 수 있는 시설이 들어설 예정이다. 전문 그로서리 스토어뿐만 아니라 아카데미, 교육과 놀이가 결합된 키즈 콘텐츠, 의료·뷰티·헬스케어 등의 다양한 서비스가 제공된다.



또한, 단지 인근에는 삶의 질을 향상시키는 생활 인프라가 모두 들어서 있다. 이 단지는 운정신도시 중심 상업지구내에 위치해 있고 이 외에도 이마트, 홈플러스 등이 가깝다. 또한 고양지원파주시법원, 대한법률구조공단, 우체국, 운정보건지소 헬스케어센터등이 인접해 각종 공공서비스 혜택을 받을 수도 있다.

교통여건도 우수하다. 수도권 경의중앙선 운정역이 역세권에 위치해 있다. 또, 향후 GTX-A 노선(예정)이 연결되면 서울 삼성동과 20분대에 이동할 수 있으며, 3호선 연장(예정) 등 교통여건이 더욱 향상될 전망이다.

시공사에서 제공하는 서비스도 눈길을 끈다. 영진종합건설은 시스템에어컨(지역냉방 펜코일 유니트) 5대, 3구 하이브리드 쿡탑, 식기세척기, 비스포크(냉장고, 냉동고, 김치냉장고, 변온고) 4대, 무선AP 등 빌트인 가전이 모두 무상으로 제공한다.

‘레이크필드 운정 위버젠’은 내 집 마련은 물론 투자 진입 장벽까지 낮은 편이다. 분양가의 10%인 계약금에서 3,500만원만 납부하면 잔여 계약금은 대출을 통해 마련할 수 있으며, 중도금 60% 무이자 혜택도 제공한다. 중도금 무이자 혜택은 통상 분양가의 60%인 중도금 대출 이자를 건설사 또는 시행사가 대신 부담해주는 혜택이다.

‘레이크필드 운정 위버젠’의 견본주택은 경기 파주시 일원에 마련돼 있으며, 현재 선착순 동호수 지정 계약을 진행 중이다.

출처 : https://www.sedaily.com/NewsView/2664C33FN3

728x90