지식 그래프에서 네트워크 과학을 사용하여 통찰력을 얻는 방법
“`html
네트워크 과학을 사용하여 지식 그래프에서 통찰력 얻기
이 영상에서는 네트워크 과학을 사용하여 지식 그래프에서 통찰력을 추출하는 방법을 설명합니다. 복잡한 그래프를 보고 주요 아이디어, 상호 연결 방식, 주요 주제 클러스터, 클러스터 간의 상호 관계, 클러스터 간의 급격한 차이점을 기반으로 아이디어를 생성하는 방법, 그리고 그러한 차이점을 연결하는 가능성을 고려하고 AI를 사용하여 그 차이점을 연결하는 아이디어를 생성하는 방법을 배울 수 있습니다. 또한 그래프의 트렌드를 분석하여 시간이 지남에 따라 담론이 어떻게 진화했는지, 인기 있는 주제가 무엇인지 등을 알아볼 수 있습니다.
예를 들어, infron notus의 Obsidian용 새 그래프 보기 플러그인을 사용합니다. 이 플러그인은 info.com에서 다운로드할 수 있습니다. 자신에 대해 간단히 소개하자면, 저는 infron notus의 개발자 Dimitri입니다. 실제로 여기에 주요 버전이 있으며 여러 그래프 분석 옵션이 있습니다. 텍스트 네트워크 분석을 기반으로 하므로 텍스트를 네트워크로 시각화한 다음 그래프 분석 지표를 다양하게 계산하여 정말 흥미로운 통찰력을 얻을 수 있습니다. 저는 지난 10년 동안 작업을 해 왔으며 이 주제에 대한 지식을 여러분과 공유하고자 합니다. YouTube에서 이에 대해 많은 사람들이 문의했기 때문입니다. 이 채널에 구독해 주시면 동일한 주제에 관심이 있는 다른 사람에게 이 영상이 추천될 수 있습니다.
시작하기
우선 infron notus 플러그인을 사용하여 Obsidian의 페이지를 시각화합니다. 대장 미생물에 관한 페이지를 선택했습니다. 연구를 진행 중인 주제입니다. 여기서 컨텍스트 메뉴를 열고 “infron notus 그래프 열기”를 클릭합니다. 그러면 infron notus가 모든 위키 링크 또는 Obsidian에서 언급되는 대로 노드로 시각화하고 공동 발생을 연결로 표현합니다. 같은 단락에 같은 위키 링크 언급이 나타나면 여기에 연결로 시각화됩니다. 예를 들어 장과 고혈압, 미생물 등이 많이 나타납니다. 이것이 그 작동 방식을 설명하는 것입니다.
일단 텍스트를 텍스트 네트워크 그래프로 표현하면 여기에 다양한 지표를 적용할 수 있습니다. 사람들이 항상 하는 일 중 하나는 Force Atlas 레이아웃을 적용하여 Force Atlas 레이아웃이 무엇인지 보여주는 것입니다. infron notus의 주요 버전으로 이동하여 회로 레이아웃과 같은 것을 보여준 다음 ForceAtlas 레이아웃을 클릭하면 무슨 일이 일어나는지 확인합니다. 가장 많이 연결된 노드(예: 이 경우 철학과 개인)를 서로 멀리 밀어내고 해당 노드에 연결된 노드는 집합을 형성하여 가장 많이 연결된 노드에 더 가깝게 밀어냅니다. 이렇게 하면 이 특정 텍스트에서 어떤 용어가 같은 컨텍스트에 나타나는지에 대해 정말 멋진 시각적 표현을 얻을 수 있습니다.
Obsidian으로 돌아가면 여기서도 클러스터를 볼 수 있습니다. 예를 들어 신장 질환이 용혈성 요독 신증후군과 많이 나타나고, 고혈압은 장내 세균과 손상과 더 많이 연결됩니다. 서로 옆에 정렬된 같은 색의 노드 클러스터가 있으며 이는 Force Atas 레이아웃과 커뮤니티 탐지 알고리즘을 결합하여 만든 것입니다. 이 영상 설명에 있는 연구 논문에 대한 링크를 제공하겠습니다. 이를 통해 모든 과학적 참고 자료를 확인할 수 있습니다. 기본적으로 이를 통해 무엇을 할 수 있는지 알아볼 수 있으며, 그래프를 보고 이를 해석하고 싶을 때 가장 먼저 할 수 있는 일은 레이아웃을 보고 그 레이아웃의 기본 원리를 이해하는 것입니다. 이 경우 커뮤니티 노드를 함께 정렬하는 것입니다. 이를 통해 이미 이 문서에 존재하는 주제 클러스터를 이해할 수 있습니다.
구조 이해하기
예를 들어 여기 주제 패널에 나열된 클러스터가 모두 있습니다. 미생물 다양성을 클릭하면 이는 한 클러스터이고, 거대한 도움은 또 다른 클러스터이며, 식물 발효는 또 다른 클러스터입니다. 위에 표시된 노트를 볼 수 있습니다. 미생물 대사도 또 다른 클러스터입니다. 여기를 클릭하면 그 클러스터 내부에 있는 노드와 추가 정보를 더 많이 볼 수 있습니다. 이것은 네트워크 과학을 사용하여 지식 그래프를 분석하고 먼저 구조와 특정 네트워크에 존재하는 클러스터를 이해하고 클러스터가 서로 연결되는 방식을 이해하는 정말 좋은 접근 방식입니다. 사실 infron에서는 모듈성이라는 지표도 있습니다. 이는 백분율로 측정되지만 기본적으로 0.68입니다. 여기에는 이 측정값이 40% 이상이면 네트워크가 모듈식임을 의미하며, 이는 커뮤니티 구조가 주제 클러스터에 대한 정보를 얻는 데 충분히 두드러짐을 의미합니다. 0.4보다 낮으면 네트워크가 너무 상호 연결되어 실제로 구별되는 클러스터가 나타나지 않는 반면, 이 경우 그렇지 않습니다. 실제로 이 노드를 모두 이 노브를 사용하여 표시하면 더 잘 이해할 수 있습니다. 이 클러스터가 있고 여기에 또 다른 클러스터가 있으며 이 클러스터는 서로 거의 연결되어 있지 않습니다. 따라서 이 측정값이 높은 이유이며, 네트워크 과학을 사용하여 지식 그래프를 분석할 수 있는 또 다른 측정값입니다. 이 측정값이 클수록 그래프의 커뮤니티 구조가 더 분산되고 그 주제 클러스터를 연결하는 데 더 많은 이점을 얻을 수 있습니다. 따라서 지식 그래프와 관련하여 할 수 있는 첫 번째 작업을 알 수 있습니다.
아이디어 연결하기
이 경우 매우 분산되어 있습니다. 즉, 항목을 연결해야 하며, 여기에 자동 생성된 이름도 제공됩니다. 예를 들어, 뇌 보호 AIS와 식물 발효는 관련 없는 주제이지만 이 제안이 흥미로운 이유는 아직 연결되지 않은 아이디어와 주제를 연결하는 데 도움이 되기 때문입니다. 따라서 이 두 주제 간의 연결을 생각해 본다면 아마도 이 특정 지식 그래프에 더 많은 연결성을 제공하는 새로운 아이디어를 만들어 낼 것입니다. 이 특정 담론을 더 발전시키는 데 유익할 가능성이 있습니다. 원한다면 직접 연결을 생각해 볼 수 있습니다. 예를 들어, 제가 좋아하는 것은 그래프를 보고 뇌와 장 사이의 연결이 나타나고 식물 발효와 식물을 소비했을 때 어떻게 소화되는지가 나타난다는 것입니다. 그런 다음 두 주제가 서로 연결될 수 있는 방법을 생각해 봅니다. 예를 들어, 특정 유형의 식물을 섭취함으로써 뇌-장 연결에서 개선할 수 있는 것이 있습니까? 이 과정은 어떻게 작동합니까? 이렇게 하면 아직 생각하지 못한 매우 흥미로운 방향으로 연구를 진행할 수 있습니다. 이렇게 지식 그래프를 사용하고 네트워크 과학 통찰력을 적용할 수 있습니다. 다시 말해 구조를 보고, 얼마나 분산되어 있는지 파악하고(이 경우 매우 분산되어 있음), 측정값을 보고 분산된 경우 아이디어를 연결하려고 합니다.
반면에 너무 상호 연결된 경우 이러한 아이디어를