2004年08月17日

コラム97.セマンティックweb(オマケつきweb)と検索エンジンと協調フィルタリング@

コラム95回「レッシグ 「free culture」でのblogのあつかい,そしてセマンティックwebに見るwebの将来」の続き的な内容です。

 前回のコラムで説明し切れなかった、「セマンティックweb」の「セマンティック」とは、意味とか意味論とか言う用語で、コンテンツに図みたいなさまざまな属性情報(メタデータ)を追加していく、という概念です。

図にするとこんな感じでしょうか。「オマケつきweb」と考えると良いと思います。
semantic.gif


 この概念を実現するために、それぞれの付帯情報の標準的な書式があり、RDFやRSSのように技術としてすでにかなり普及しているものもあります。

 概念の部分と、それを実現している技術の部分、単に「セマンティックweb」と言ったときには両方のことを指してしまい、話がややかみ合わなくなることがあります。
「どんなオマケを、どういうふうにつけるか」の話と、「オマケをつけるというアイデアそのもの」がゴッチャになると、話がおかしくなる、という話です。

 トラックバック先の江島健太郎さんのblogなんかは、「メタデータという思想はいいとして、いまの標準化のやり方では問題があるし、そもそも"標準化"じたいがいいことかどうか?」という問題提起です。他にも、まだ普及が甘いとか、現状マニアしか使ってないとか、そういう話はあります。

 今回のコラムで話題にしたいのは、概念として「オマケをつける」という「考え方」がアリだということ、今の時点でもそのおかげでこんな新しい、便利なものがでてきている、というお話です。

 付帯情報が加わることで、
 →カテゴリの付加情報に注目して、ニュースだけを絞って持ってくる
 →付加情報同士を比べて、関連の有る情報を並べて表示する
 →関連のある情報同士を比べて、どういう意見グループが存在しているか
 →ニュースか旧文か
 →もともとどういう意見の人の発言か
 →この発言に賛同している人はどのぐらいいるか
 などなどを掘り下げていくなど、データベース的に使うことも出来ますし、Tomo’s HotLineで言われているような、セマンティックメールもありえるかもしれません。(もっとも、メーラーはすでに結構付加情報がついてはいます)

network stylyサイトで言われている話のような、拡張していくとどこまでいくかわからない、という魅力もあります。

 すでにRSSというメタデータは実用化されていて、blogシステムのほとんどや、ニュースサイトの多く(朝日新聞まで!)は対応しています。手元のパソコンでRSSリーダを使うと、非常に便利にサイトの更新情報をとってくることが出来ます。
 (RSSのニュース斜め読みの便利さ、これについては、何度解説を読んでもわからないです。自分で無料のRSSリーダーをインストールして使ってみることをオススメします。自分が使っているのはglucose
それでも解説を、という人はセマンティックWeb技術・RSSを解説するサポティスタ選定「年間最優秀サイト2003」補講RSS解説編(サッカーファン向け)を見てください。

この、セマンティックwebという仕組みは、検索エンジンの仕組みと多少似ている部分があります。
検索エンジンは、個々のコンテンツに、この図のような意味をもたせることで
seo_mini.gif
拡大図(用語説明つき)
順位の上下をつけています。セマンティック化している、と言えるかもしれません。
 検索エンジンの仕組みの詳細な説明は以下のサイトを。
サーチエンジンの仕組み(1) − クローラー
サーチエンジンの仕組み(2) − インデクサー
サーチエンジンの仕組み(3) − クエリーサーバー -
 

とはいえ、検索エンジンはこの仕組みを実現するのに、ものすごいマシンパワーと開発ノウハウをつぎ込んでいます。
 自分がクライアントPCでRSSリーダーを使うのに比べたら、段違いの資産を使って、検索エンジンという仕組みを実現しています。これは、検索エンジンが意味(セマンティック)の解析を、自動で行っているからで、セマンティックwebの試みは、この部分を多少「きめごと」にしてあげることで、容易にやりとりできるようにする仕組みだといえるかもしれません。キーボードを使って入力する(セマンティックweb)のと、言葉で話してコンピュータが解釈する(検索エンジン)の違いといえるかもしれません。

セマンティックwebで、blogのトラックバックのような仕組みも生まれました。これはamazonのように、「この本を見た人は、こんな本も見ています」のように、付帯情報間をつないでいく仕組みです。セマンティックwebの仕組みにより、コミュニケーションがしやすくなります。

 この仕組みのことを「協調フィルタリング」と呼びます。フィルタリングというと勝手に分けるイメージがありますが、誰かが決めた分け方でなく、ユーザが自分の好みを選んだ結果が蓄積されるとか、そういう仕組みのことです。
セマンティックwebの仕組みは、「ネット全体のamazon化」のような可能性を秘めています。

 ネット全体を巻き込んだ「協調フィルタリング」が可能になることで、実際のメディア含め、ネットの姿が多少変わってくると考えます。

 「どう変わる」かについては、次回つづけて書きます。


参考

セマンティックweb CNET
http://japan.cnet.com/column/watch/story/0,2000050148,20053510,00.htm

セマンティックweb CNET ティム・バーナーズ・リー
http://japan.cnet.com/news/ent/story/0,2000047623,20062001,00.htm

 

N | Rg0) | gbNobN (0)