ネットワーク理論でみた技術革新 ③
この記事は日本経済新聞「やさしい経済学」2010年7月7日〜19日に掲載されたものです。
坂田一郎 教授
「学術俯瞰」とは
前回述べたように、急増し、細分化する知識を社会的な課題解決へと結びつける戦略の立案は、ますます難しくなっている。そうした技術のマネジメントを支援する手法として注目されるのが、ネットワーク理論と情報技術、それに専門家による判断とを組み合わせた「学術俯瞰(ふかん)」とよばれるものだ。
この手法を簡単に紹介しよう。論文をノードとし、論文間の引用関係をリンクと定義すると、引用関係を軸に関連づけられた学術知識の引用ネットワークが構築できる。先に出版された論文を引用するということは、自分の論文と被引用論文との間の内容的な関連性が強いという著者の意思表示で、引用ネットワークは内容的な類似性によってつながったネットワークであると考えることができる。
今日、主な学術雑誌に掲載された論文群の書誌情報は、デジタルデータ化され、取り出したい知識内容に合致した検索語を入れれば容易に取り出せる。数万から数十万件規模の論文やその数倍の引用関係であっても、コンピューターを利用すれば、比較的短時間で引用ネットワークを構築することが可能である。
次に、一般にリンクマイニングと呼ばれる技法で、このネットワークの分析を行う。この技法は主に図書館情報学の分野でよく用いられてきたものだ。その代表的手法には、ランキング、クラスタリング、構造予測の3つがある。ランキングは、ノード(この場合は論文)に対し、目的に応じた順位を付けることである。これによって、ユーザーが膨大な論文群の中から、目的に応じて適切な論文を探しだすことが可能になる。ランキングにはネットワーク特徴量と呼ばれる指標が用いられる。よく知られた指標としては、被引用回数、ページランク、各種の中心性(ノードがネットワークの中でどの程度中心的な存在であるかを示すもの)がある。
クラスタリングとは、ネットワークを部分集合に切り分ける手法だ。学術俯瞰においては、引用関係の密なグループ、すなわち内容的に関連性が特に深い論文群が部分集合として切り出される。これによって大きな知識領域をその部分集合群とそれらの間のつながりの束として分解できる。 最後の構造予測とはネットワークの構造の既知の部分を手掛かりに未知の部分を予測することだ。例えば特定の論文の将来の引用数、すなわち成長性を予測することなどが行われている。これらには情報技術が要るが、意味の判別に専門家の助けを借りる必要がある。次回は実例を紹介する。
ネットワーク理論でみた技術革新 連載一覧(坂田一郎教授)
①幅広い分野に応用 ②知識の爆発・細分化 ③「学術俯瞰」とは ④研究の「見える化」 ⑤技術ロードマップ ⑥研究協力の実像 ⑦学術と産業技術 ⑧ミッシングリンク