オープンデータからの発見、そしてデータ加工貿易へ

東京大学名誉教授、事業構想大学院大学教授
岩田修一

2013/8/7

AFP=時事

はじめに

ビッグデータ、オープンデータ、オープンアクセスが、時代のキーワードになりつつある。首相官邸からも本年6月17-18日に英国ロック・アーンで開催されたG8サミットにおいても首脳宣言にオープンデータの推進が盛り込まれ、これを踏まえた具体的な取組内容やスケジュールについて記述された「オープンデータ憲章」と付属文書が合意されたことが発信されている。また、今回のG8サミットに関連し、英国王立協会がG8各国の科学・技術担当大臣及び各国アカデミー会長との会合を6月11-12日ロンドンで開催し、日本からは科学・技術担当大臣代理として総合科学技術会議の原山優子委員、日本学術会議からは大西隆会長が出席した。

議題にはオープンデータとオープンアクセスが入っていたが、1970年代から科学技術データの共有と活用に興味を持ち、連続した二つの特定研究「広域大量情報の高次処理」と「情報システムの形成過程と学術情報の組織化」に生意気盛りの大学院生として関わっていた筆者としては、21世紀も最初の10年が過ぎてしまった今、当時と同じ事が議論されているので40年余時代をさかのぼって妙に若返った気分になっている。この小稿では、既に別の機会に報告したことは、一部、参考文献として示し、何処にも記述した記憶の無い古い事を簡単に振り返りながら次の百年の仕事を考えてみたい。

データの戦略性と情断と科学

上記の特定研究の代表者は島内和彦先生と猪瀬博先生で、後にCODATA (Committee on Data for Science and Technology) のPresidentを務められた小谷正雄先生も常時参加者のお一人であった。3先生とも既に鬼籍に入られてしまったが、多くの事を教えていただいた。その中で表題のデータにも関係する3件を以下に紹介する。

(1)連合軍にはデータがあったから日本のマレー半島への侵攻は心配しなかった。
1941年、日本海軍の航空隊はマレー半島東方海上で、イギリス東洋艦隊の主力戦艦プリンス・オブ・ウェールズおよびレパルスを撃沈し、南西太平洋の制海権を掌握し、マレー半島上陸開始し、太平洋戦争開戦後約5ヵ月間に、香港、マレー半島、フィリピン、ジャワ,ビルマの各地を占領し、これら地域の豊かな資源で長期戦態勢は整ったと考えた。マレー半島の天然ゴムの独占は軍事用車両のタイヤに不可欠の資源であり、極めて重要な戦果と考えた。しかしながら連合国側は代用品の開発と製造のための基盤となる科学技術データを既に獲得していて、天然ゴムにかわる合成ゴムの開発製造、人造石油の開発・製造などの技術的な可能性を確認していた。日本は連合国に対し、局地戦で一時的に勝利し、情報戦で完敗していた。
(2)油が断たれる事を油断、情報が断たれる事を情断と言い、それは冗談ではすまされない。
1973年の第四次中東戦争を契機にして石油輸出国機構(OPEC)加盟産油国のうちペルシア湾岸の6ヶ国が、原油公示価格を引き上げ、アラブ石油輸出国機構(OAPEC)が、原油生産の段階的削減を決定し、当時の日本の経済や社会に大きな影響を与えたが、同じ文脈で堺屋太一氏は、中東からの石油輸入が制限されるようになった時に日本はどのような状況下に置かれるのかを小説として書いていて、題目を「油断」とし、油断をしていると「油断」が起きると警鐘を鳴らした。油の代わりに情報が断たれる事を情断と言い、それは日本にとって油以上に厳しいとの議論があった。当時は日本国内で生産される価値のあるオリジナルな情報が少なく、情報の輸入超過が指摘されていた。
(3)普遍性があって高品質のデータがあって初めて科学と技術の新たな展開が始まる。
物質中の線状の配列のズレを転位というが、物理的に厳密な定義が容易ではない。電子線と物質との相互作用で影を観る事ができるが、それは実体ではない。点の配列に関する乱れを幾何学的に定義して影と対応付けて仮の実体とし、特徴量としてのデータを獲得できるが、それは科学的な実体を与件とした収束性のあるデータなのだろうか?活断層に関する騒ぎにも同様の危うさが感じられるが、近年のビッグデータのブームにも参考となる議論である。

オープンデータとオープンアクセスの本音

関係者が協力しながら共通の場にデータを集め、評価し、編集する事で、公共財としての知的基盤:データコモンズが形成され、学術の進歩が加速し、新たな科学的な発見につながるような嬉しいこともあるというのがオープンデータとオープンアクセス運動の原点である。データを集めれば何かパターンが形成され、形式を与えて整理すれば地図ができる。そして、この原点の周辺には様々なインセンティブが渦巻き、バーチュアルな世界ではあるが都市におけるコモンズ、マーケットの形成に類似のメカニズムとパターンがある。

データを集めるインセンティブと生まれる価値についての展開については、社会的な現象論として興味深いものがあるが、敢えて大別すれば"集める/集まる"、"使う/使われる"、"編集する"作業に付随したパターン形成である。いずれにしても"集めれば何かが起る"というデータコモンズの実現には様々な課題があるため、CODATAは国際集会を開催しながら、データコモンズの可能性を探ってきた。国際情報社会サミット(2003年ジュネーブ、2005年チュニス)にはICSUと協力して学術団体を代表して参加、第1回サミットではUNESCOとITUが企画したパネルにパネラーとして参加、第2回サミットでは、サテライトシンポジウム"Past, Present and Future of Research in the Information Society"を主催した他、サミット全体会議で発言し、報告した。学術データの公共財としての共有と活用が情報格差の解消につながるという提言がサミットでの原則宣言に反映された。

"編集する"ことに本来の意味のある学術情報についての公開については、IUBGレポート、OECD CSTP最終報告への反映やCODATA, ICSTI, INASP, ICSU, UNWSCO, TWAS, OECDが国際ワークショップ"Creating the Information Commons for e-Science: Toward Institutional Policies for Action"を共催し議論の結果は上記の国連情報社会サミットに反映されている。また一次データに基づいた学問的基盤を構築する装置として機関誌である電子ジャーナル(Data Science Journal)を刊行し、論文を補完するデータジャーナルの本格的な検討を2012年度から開始しているが、最近は地球惑星科学分野のような観測科学分野を中心に同様の活動が活性化している。国内においても科学技術基本計画の基軸の一つとして、これまで10年余にわたり、標準データなど一部に関して経済産業省、文部科学省などの知的基盤整備計画によって整備計画が進められてきた実績がある。

しかしながら"集める/集まる"、"使う/使われる"マーケットに吸い寄せられて日本から発信される高品質のデータや知識は欧米の大手出版社や学術組織やICTビジネスによって構築されたレジームで"編集"されて、必ずしも日本国内へ適切に還流されているとはいえない。このことは長年指摘し続けている課題であるが一般論を超える本格的な物語が生まれていなかった。

そして"集める/集まる"、"使う/使われる"、"編集する"を的確に実施しなければならない深刻な要請が3.11によって提起された。福島第一原子力発電所の事故が学術分野に突きつけた課題、すなわち分野間の隙間、陥穽を放置し、具体的な課題に適切かつ迅速に対処できなかった学術としての脆弱性である。低線量被曝に関する問題は、オープンデータ、オープンアクセスの理想を実現するための社会的な要請の極めて高い問題であるが、異分野の専門家が協力して人々の健康リスクの低減を実現するための共通のプラットフォームは実現していない。社会的な要請に、何故、専門家は協力して先端科学技術だけでは対応できない隙間を埋める作業に着手しないのか?オリジナル論文だけが評価される学術の姿への危機感がオープンデータ、オープンアクセス、そしてデータジャーナルへの動きとなり、データ科学への流れになろうとしている。

データ加工貿易

我が国は、国内に乏しいエネルギーや鉱物資源を輸入し、従前の製品に格段の改良を加えて、より完成度の高い製品を生産・供給することによって、世界に貢献し、対価を獲得することで自国の繁栄を築いてきた。この様子は経済産業省が作成した下図に見事に示されている。世界的なシェアの高いしっかりした産業も数多く存在する。

しかしながら3.11以降、エネルギー価格は上昇し、オイルピーク、ガスピーク、気候変動が連動した「油断」リスクが高まり、また本質を捉えるための眼力-本当のデータリテラシーの喪失は社会を「情断」状態へと引き込み始めているように感ずる。旧来の手法が有効であるかどうかは明らかではないが、この戦略を将来も持続的に成功させるためには"脱物質"のための試行錯誤が必要で、世界的な潮流であるオープンデータ、オープンアクセスに加わって、利用可能な普遍性の高い科学技術データを徹底的に活用することと、不足しているデータや知見を追加して未経験の事象に迅速に適応するための補完能力、知力を涵養して、化石燃料を駆動力にした大量生産/大量消費/大量廃棄パラダイムから脱皮する事が必要なことは誰もが納得する事であろう。つまり石油と鉱物資源を利用した加工貿易ではなく、知力を使ったデータ加工貿易である。

おわりに

機会があって蒲島郁夫熊本県知事から経済規模一千億円とも見積もられる「くまもん」の政治経済について拝聴する機会があった。同経済のポイントは楽市楽座である。オープンデータ、オープンアクセス、オープンガバメントのアイデアは昔から日本にもあった。朝市もいたるところにある。江戸時代の創造力は葛飾北斎や先端的なゲノムサイエンスや遺伝子工学でも創りだすことのできないたくさんの種類の朝顔を産み出した。きっと何かが起こると思う。

参考文献

  1. Editorial: Science and the Digital Divide, Shuichi Iwata and Robert S. Chen.
    Science 21 October 2005: Vol. 310. no. 5747, p. 405
    DOI: 10.1126/science.1119500
  2. Editorial: Science and the Information Society, Jane Lubchenco and Shuichi Iwata.
    Science 12 September 2003: Vol. 301. no. 5639, p. 1443
    DOI: 10.1126/science.301.5639.1443
  3. 岩田修一:学術の動向「科学技術データとオープンアクセス」2005年12月号、「CODATAの活動と展望について Data-centric Science and Societyへ」2009年5月号他
  4. Shuichi Iwata et.al.: Alloy Design by Automatic Modeling and Estimation of Values From Experimental Data 1977, J.of Fac. of Eng.,Univ. of Tokyo, XXXIII,No.4.
  5. 岩田修一共編著:「新材料開発と材料設計」1985年5月 ソフトサイエンス社.