한국 위키피디아의 편집자 네트워크를 이용한 융합분야 탐색
자료요약
이 연구는 빅데이터 시대의 대표적인 지식백과 위키피디아가 ‘어째서 엉터리 정보로 가득 차지 않는가’라는 질문에서 시작하였다. 이 연구의 목적은 위키피디아의 문서를 네트워크화하여 연관분야 및 융합분야를 탐색하는 것이다. 위키피디아에는 다양한 분야의 문서들이 있지만, 단계적 카테고리 분류가 아닌 태그 형식의 링크이기 때문에 떠오르는 융합분야를 찾는 것에 적합하지 않다. 연구대상은 위키피디아 한글사이트에 게시된 모든 지식 38만 건, 저자 56만 명으로 데이터의 총 사이즈가 200GB이상인 XML파일이다. 연구도구로는 오픈소스 소프트웨어 NodeXL을 사용하여 네트워크 분석을 수행하였다. 문서제목을 vertex, 편집자를 엣지로 하여 네트워크를 구성하고 그룹으로 분류해보았다. 내부 네트워크 및 그룹 간 네트워크 분석을 통해서 나온 연관분야가 기존의 연관분야와 일치하는가, 새로운 융합분야가 있는가를 알아보았다. 기존의 연구에서 그래프방식의 카테고리 링크를 이용해서 일부 분야 네트워크를 구성한 것과 다른 방식으로 네트워크를 구성한 것이 차이점이며 이를 통해서 새로운 융합분야를 찾을 수 있었다. 이 연구는 위키피디아의 문서가 신뢰할 수 있으며, 편집자가 전문 지식을 가지고 편집한다는 것을 가정하고 진행되었다. 분석결과 위키피디아의 지식과 저자는 하나의 분야에 집중되어 있기보다는 다양한 분야에 융합적으로 확산되는 것으로 확인되었다.








