鴨川η

citation weights

はじめに

引用ネットワークについて調べていると重み付けに関する論文として

Connectivity in a Citation Network: The Development of DNA Theory

を見つけた. この中で引用ネットワークのエッジの重み付けについて3つの方法があるのだが,英語力が壊滅していて理解するのに時間がかかった.

これらの重み付けアルゴリズムは,pajekに実装されているらしい.


本題

前提

以下のような有向グラフを考える.このグラフは,論文のFig. 3 に相当する.

citation-g

引用ネットワークを考えているので,この場合は番号が大きいほど古い論文となる.

以下では,エッジ 3->5 の重みについてだけ説明する.

node pair projection count

一番単純な重み付けの方法. 先のグラフにおいて,パスは問わずに到達可能なノード対は以下の19ペアある.

3 -> 5
3 ->12
3 ->15
3 ->20
3 ->21
3 ->22
5 ->12
5 ->15
5 ->20
5 ->21
5 ->22
12->15
12->20
12->21
12->22
15->22
20->21
20->22
21->22

この中で該当するエッジを含むペア数を重みとする. 3->5の場合,以下の6通りなので重みは

3 -> 5
3 ->12 # 3->5->12
3 ->15 # 3->5->12->15
3 ->20 # 3->5->12->20
3 ->21 # 3->5->12->20->21
3 ->22 # 3->5->12->20->21->22 or # 3->5->12->20->22 or # 3->5->15->22

ここから間違ってるかもしれない.

22は固定して,それ以外のノードを1つ選ぶ. 選んだノードから22へのパスの中で重み付けしたいエッジを含むパス数を重みとする.

3->5の場合,以下の3つのパスがあるので が重みとなる.

3->5->12->15->22
3->5->12->20->22
3->5->12->20->21->22

search path node pair

一番よくわからなかったもの.

グラフの末端よりも中間に現れるエッジに重みがつきやすくなる.

search path link count と同様に終点となる22以外の任意のノードを1つ選び,22へのパスを考えると以下の3つが該当する.

3->5->12->15->22
3->5->12->20->22
3->5->12->20->21->22

これらの3つのパスについて, node pair link count で使ったノード対をすべて列挙し,該当するエッジ 3->5 を含むペア数をカウントする. この場合は,13個が該当し,これを重みとする.

3-> 5
3->12
3->15
3->22

3-> 5
3->12
3->20
3->22

3-> 5
3->12
3->20
3->21
3->22

おわりに

間違っていたら教えてください...