震災とネットの役割 ウェブ情報、分析力高めよ

こちらは、日本経済新聞「経済教室」に
2011年5月5日に掲載された記事内容に、加筆・編集をしたものです。

松尾 豊 准教授

導入

ネット上のソーシャルメディアがますます用いられるようになっている。ソーシャルメディアとは、もともと米国で使われている言葉であるが、いま注目を集めているのは、1月に映画が公開されたFacebook(FB)であろう。以前から2chやmixiなどのユーザは多かったが、それに加え、twitterやFBなどのユーザは増加する一方で、リアルタイムな情報がより多くの人により発信されている。ニールセンの2010年12月の調査では、国内でのtwitterユーザ数は1200万人、FBユーザ数300万人であり、海外での流行を追う形で、着実に増加している。エジプトやリビアの動乱でtwitterが重要なメディアとなったという話は記憶に新しく、今回の地震でも多くの人がtwitterを使った。電話が通じなくてもネットにつながれば情報が入手でき、ソーシャルメディアを通じて友人との連絡を行った人も多い。

セマンティック技術

一方で、今回の震災では、ネット上でさまざまな噂やデマが飛び交い、その内容が正確に確認されないまま情報が広がる現象が多くみられた。本来、情報の正確性や意味内容を把握して適切に噂やデマを防止する手段があればよいのだが、これは技術的には難しい。情報の意味内容を、コンピュータが把握する技術は、「セマンティック技術」と呼ばれ、以前から研究が行われている。遡れば、コンピュータに言語を理解させるという夢は、コンピュータが出現した当時からあり、自然言語処理や人工知能の学術分野では、意味理解の研究が長年にわたり行われている。

こういった意味理解の形が、現在、最も分かりやすい形で見えるのが、検索エンジンであろう。検索エンジンは、ウェブページを単語もしくは文字列に切り分け、ユーザの入力するキーワードの意図を推測しながら、最も適切なウェブページを提示するが、通常、検索エンジンは、ページの意味内容まで立ち入らないことが多い。例えば、「地震」「津波」というキーワードをいれたときに「いま起こった地震の津波の可能性」を調べたいのか、「地震によって津波が起きる仕組み」を知りたいのかは区別されない。しかし、セマンティック技術では、「何によって何が引き起こされるか」「何がいつ起こったか」「誰が誰と何をしたか」などの意味内容を分析して蓄積する。それによって、「バラク大統領はどこで生まれましたか」のような問いに、検索エンジンが「ハワイ」と直接答えることができる。Microsoftの検索エンジンであるBingは、こういった意味内容の分析を目指している。国内では、SPYSEEというサービスがあるが、ウェブ上の記述から人と人との関係を抽出する。

ソーシャルメディアの分析

セマンティック技術をソーシャルメディアに活用し分析することにより、リアルタイムにさまざまな現象を観測することができる。2005年ごろからブログの分析を行う技術は、活発に研究や実用化が進められていた。ブログの情報を分析することで、言い回しや話題によって、ブログの著者の性別や年齢、居住地をある程度の精度で推定することができる。そうすれば、ある商品に関する購入者の反応を、性別や年代とあわせた形で調査できる。例えば「日経新聞」に対してポジティブなことを言っているはどのくらいの年代に多いかということが分かる。

このようなサービスは、国内でも海外でもすでに商用化されて久しい。それに加え、最近では、twitterなどのリアルタイムに近いデータを分析する技術が進展している。例えば、米国地質研究所では、twitterを観測することによって、世界のどこで地震が起こったかをすばやく察知する研究を行っている。同様の研究が、東京大学知の構造化センターでも行われており、震度3以上の地震の9割をtwitterのデータだけから知ることができるという研究成果1 がでている。(図は、ある地震が起こったときに、日本中で地震に関するつぶやきが現れる様子を表している。)また、twitterを使ってDOW平均株価を予測する技術がイギリスで、twitterから選挙の結果を予測する研究がドイツで行われている。国内でも、選挙の予測、商品の売れ行き予測、経済指標の予測、日経平均の予測など、さまざまな試みが行われ、徐々に実用化が進んでいる。

これらが示唆することは、ウェブには多くの人が情報をリアルタイムに書き込んでおり、これらを分析すれば、世の中で何が分かっているかを、今まで以上に知ることができるということである。これは考えてみれば当然であり、もし仮に日本人全員がそのとき思ったことをウェブに書くような極端な世界を想像すれば、その書き込みを読むことによって、人々が何に興味をもっているのか、特定の政策に対してどう思っているのか、日常生活での苦労や不便など、分かるはずである。極端な想像ではあるが、多くの人がウェブに情報を発信し、さらにセマンティック技術による分析手段が進んでいくにつれて、この世界に一歩ずつ近づいている。つまり、ウェブによる「社会の観測」と「社会分析」、そこから一歩進んだ「予測」が今後、さまざまな形で実現されると考えられる。

限界と有効範囲

もちろん、ウェブ上の意見は一部のネットユーザーの意見ではないかという指摘もある。それは正しい指摘であろう。確かに、以前はネットで書き込みを行っている人は、ネットにどっぷり使った一部の人であったかもしれない。しかし、ブログ、twitter、SNSと多くのサービスが一般的になり、多くの人がウェブを使うようになった結果、ウェブの情報が、社会全体の代表性をもつ程度が徐々に高まっている。電通が先日、ソーシャルメディアをマーケティング分析に利用するラボを立ち上げたが、それもその結果であろう。また、ウェブでは重要なことは分からないことという指摘もある。これも当然正しい。観測できることとできないことがある。企業や組織の内部情報は当然、観測できない。しかし、諜報活動に用いる情報の95%は公開情報であると言われており、大量の公開情報を読み解くことにより、多くのことを知ることができる可能性があるというのもまた事実であろう。実は、遡ること約10年、米国IBMが「Web foutain」(ウェブの泉)というプロジェクトを立ち上げ、大量のウェブ情報を分析する大規模な試みを行った。当時はよい結果を得ることができなかったが、いままさにソーシャルメディアのデータが揃ったこの時期に、ウェブからの観測、分析や予測技術が花開くタイミングかもしれない。

意思決定

ウェブによる「社会の観測」「社会分析」「予測」が徐々に実現されてくるにつれ、どんな変化が個人や社会にもたらされるだろうか。それは意思決定に関する変化であると考える。情報を適切に収集し分析することができる人は適切な意思決定ができ、そうでない人との差が広がる。Microsoftの検索エンジンは、明確に意思決定エンジンとうたっており、情報を検索することによって意思決定に活かすためのさまざまな工夫を凝らしている。Googleをはじめ他の検索エンジンも、ユーザが食事をしたり買い物をしたり、さまざまな意思決定をする際に使いやすいような工夫が凝らされている。情報の収集と分析ができてはじめて、適切な意思決定とアクションを行うことができ、これは個人、企業、さらには国といった意思決定主体に関わらず、本質的に重要である。

日本にとっての重要性

日本は、このところ産業を含めさまざまな面で停滞しているが、そのひとつに、大量の情報の収集と分析、それに基づく意思決定の弱さがあるのではないだろうか。というのも、ウェブでは世界中の多くの人々が英語で情報収集をし、そして意思決定をしている。例えば、リビアの人々がいま何を議論しているのか、ドイツの人々が日本の震災と原発についてどう語っているのか、知ろうと思えばいつでもウェブで知ることができる。ところが、言語の壁のため、これを集め、読み解くことができない。いま日本は多くの課題を抱えているが、こういった時代にこそ、情報を集め、分析し、予測し、意思決定に活かすための手段を整えることがもっと必要とされるのではないだろうか。ソーシャルメディアを、単に多くの人の暇つぶしと考えず、社会を観測する手段を考え、これを意思決定に活かしていくことは、今後の個人や企業、国としてのアクションを決める上で、重要である。こういった情報収集の仕組みや技術に関する国としての政策、学術研究、産業界の動きは不十分であり、一見、眼前の震災復興からは遠回りに見えるかもしれないが、それが日本の長期的発展には必要不可欠ではないだろうか。



(参考)

  1. Earthquake Shakes Twitter Users:Real-time Event Detection by Social Sensors
    (論文 : Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo / WWW2010, April 26-30, 2010, Raleigh, North Carolina.)