セマンティックWebコンファレンス2010

セマンティックWebコンファレンス2010というイベントに行ってきた。自分にとって、セマンティックWebというと「RDFやOWLやSPARQLでオントロジーなのね。夢があっていいねぇ。」ということと、「Webっていいながら、実践になったとたん1個のサーバ上に閉じたマニアックな検索ができてるだけじゃん」といった具合の認識しかなかったわけだが、「Linked Open Data」(LOD)というテーマが、実はまさに自分がやりたい世界なのでは?ということで興味を持って参加した。実際、LODは僕が進みたい世界に非常に近かったので「よいラベル」と「そこに向かうコミュニティ」を見つけたという意味で大収穫だったといえる。

まず最初に国立情報学研究所の武田教授という人が最初の基調講演でぐっと盛り上げてくれた。Linked Open Dataというのは、SemWebの世界でのオントロジー構築云々概念的に高い部分はとりあえず置いておいて、世の中にバラバラにそろいつつある具体的なWebAPI群をつないで云々しようという本当のWeb志向の動きのことだそうだ。数年前にSemantic Webの世界はRDFやRDFS, OWLときれいに下から上へ技術スタックを構築したわけだが、みんながOWLやらオントロジーやら観念的な上位層にフォーカスしがちだった。おそらく、だから「一台のサーバでマニアックな役に立たない検索をやって喜んでいるだけ」と世の中(僕含めて)に見られてしまってきたのだろうが、その反省に立って一番下の「インスタンス」を「リンクする」という部分をもう一回ちゃんとやってみよう流れがLODなのだという風に見えた。実際のところ、以下サイトが2−3年前に出現したのがきっかけでその周りに色々なマシンリーダブルな「リンクされたインスタンスエコシステム」が英語圏で形成されてつつあることを指して、LODといっているらしい。

http://dbpedia.org/About

ちなにに、これを企業内でやる人がでてくれば、Linked Open Data(開かれたもの)ではなく Linked Closed DataとかLinked Enterprise Dataというのも考えられるので、技術としてはLinked Dataと呼んだほうが一般化されてていいのかな?

武田教授は最後のパネルディスカッションでもいいことをいっていた。ええと、表現はちょっとちがったけど、以下のようなこと。

LODはプログラムにとっての常識になる。
LODを参照しないプログラムは常識のないプログラムであり、
LODに情報提供しない企業や製品は機械の「常識」の中にいれてもらえなくなる。

自分はずっと、LOD的なもの(LODという言葉は知らなかったけど)をやりましょうと会社の中でいろんな人に話をしてきたんだけど、

    • で、何がどう儲かるの?
    • ウチの会社にとって何がうれしいの?
    • 社会にとっても何がうれしいの?
    • アプリの作り方が変わるわけ?

とか色々言われて、あまりうまく回答できずにここ1年苦しんできた。だから、LODというムーブメントが盛り上がってきたのは非常にうれしくて、これからはマシな回答ができるようになると思うし、正直なところ個人的には「LOD万歳! LODやるぞ〜」モードになったといってもいい。

まだ、彼らのいうLODを良く理解はできていないが、

    • 僕はATOM/RESTのAPIが相互参照しあう形をもってLOD的な世界をイメージしているのに対し、
    • 彼らはRDFやOWLの世界を前提としながら、LODという言葉を作っている

というギャップが今気になっている。

RDFベースでrssがつくられ、その考え方を受けてAtomやAtomPubが生まれているので、それぞれのノードが提供するインターフェースがRDFだろうとAtomPubだろうと、本質的な違いは少ないと思いつつ、

    • Atomの世界は、その上にAtomPubやGData, ODataがあってデータの更新に強い。
    • RDFの世界は、その上にOWLやら推論やらSPARQLやらがあってなんだか色々できそうだけど、データ更新とかは弱そう。

という気がしている。おそらく両方必要なんだろう。
WebというものはStaticなのかDynamicなのかといえば、Dynamicであることは明らかなわけで、その意味でやっぱりAPIには更新系I/Fは必須だと思うし、作り上げられらLinked Dataを使って価値のある情報を引き出すためには推論やら何やらができたほうがいい。すると、両者のマッピングを考えることに意味がありそうだ。
 (SemWebの人からすると、Atomは「RSSもどき」としかとらえてくれないこともあると思うけど。最初は)

それと、エンティティとリレーション(Triple)をどこでどう持つのかという問題についても、それぞれの技術の生い立ちから来る文化的な差があると思っている。

とにかく、相手(SemWeb)を知らないと議論ができないので、会場で「実践Semantic Web」という本を買った。まずは読んで勉強してみたい。