騒がしい未来

無駄に元気な毎日を送っている、チームラボ所属 高須正和のブログです。最近はtwitterメインで更新中

ムチャクチャ面白いイベントでした。会場もよく、雰囲気もコアながらそれほど浮世離れせず、使い回しのプレゼンもなく、ガチな感じが強くてよかったです。

 

プレゼン資料置き場
http://homepage3.nifty.com/toremoro/study/SBM3.html

■プログラム
エコメンデーション 講師:佐々木 祥 ,上村 理(東京工業大学 博士課程、修士課程)
SBMの推薦アルゴリズム ~はてなブックマークのレコメンド(関連エントリ)の仕組み~ 岡野原大輔 PFI 特別研究員
SBMはミニブログです。: 福冨 諭(Webプログラマ) SBM研究会
SBMを利用したフィッシングサイト検知とその展望 -集合知セキュリティという考え方- :中山心太(NTT研究所)
言語表現に基づくブックマークコメントの分類とフィルタリング:山田 剛一(東京電機大学 未来科学部)
Livedoor clip おもしろ大改造計画 @mala
SocialDict – 英文Webページのスマートな注釈・辞書引きシステム:江原 遥(東京大学 情報理工学系研究科 学部生)
ブックマークサービス普及のためのユーザーインターフェース(UI):島津悠樹(ヤフー株式会社)
oneclip – Twitterでソーシャルブックマーク 大澤 昇平(筑波大学 学部生)

■発表
エコメンデーション 講師:佐々木 祥 ,上村 理(東京工業大学 博士課程、修士課程)
http://twitter.com/brnw
http://twitter.com/o_kamimu

Ust:

資料:
http://homepage3.nifty.com/toremoro/study/SBM3/kamimura.pdf

・SBMを利用したレコメンデーション
・レコメンデーションの基本的なアルゴリズム(協調フィルタ)
・レコメンデーションの計算機コストを下げる=エコメンデーション
・全員のプロファイルでなく、代表ユーザ(似ているプロファイル)を使えば、削減できる

実装は以下の人

・代表的、典型的なユーザを分析することで計算量を削減
>問題点 サービスによって典型的が分析できたりできなかったりする
>汎用的を目指してプロファイル決定木を構築
・テストしたところユーザ50人の場合で25%削減
・精度も問題なしの模様

>ただし、もっと大きいデータセットでもっと効果が出るかは、実装上もう少し工夫が必要

 

SBMの推薦アルゴリズム ~はてなブックマークのレコメンド(関連エントリ)の仕組み~ 岡野原大輔 PFI 特別研究員
http://twitter.com/hillbig

資料:
http://www-tsujii.is.s.u-tokyo.ac.jp/~hillbig/papers/sbm3_okanohara.pdf
参考:naoya氏のはてブ資料
http://bit.ly/zSpZg

Ust:

・はてなブックマークのレコメンド
・協調フィルタ
・開発合宿を行ったところ、タグを用いたモノが精度がよかった
・基本タグだけでやっている
(一部のものはタグ以外も使ってる)
・開発は1台 索引は圧縮している C++で開発

・google sets
(google labsで提供中の推薦エンジン。japan,USAとか投げると
「国じゃね?」とか返してくれる)をベイジアンフィルタで行う
Thrift
・数式全開タイム
・積分消去
・シータ

・アイテム数が多いので圧縮したい はてブの対象アイテムは1600万
-整数列の効果的な格納方法
-推薦に影響が少ない情報は捨てる
-要約する(スカッシング,クラスタリング)
-サンプリング+補正
・LSH使った場合 2000万アイテムに対して 4784ms > 2.56msに
locality sensitive hash
一台で数千万~数億に対応可能
・レコメンドは見せ方が課題

・LSH選んだ理由
・速度
・チューニングのしやすさ
・コサイン距離以外の実装方法は試してない
(hotateの距離計算は勝手に作ったのでコサイン距離じゃないけど)

 

SBMはミニブログです。: 福冨 諭(Webプログラマ) SBM研究会
Ust:

資料:
http://homepage3.nifty.com/toremoro/study/SBM3/fukutomi.pdf

・SBMとtwitterはそんなにデータの形式が変わらない
・SBMのほうがデータの蓄積/検索はしやすい
・twitterで過去の検索ができなかったり、検索機能が弱いのが腹が立つ
・SBMをミニブログとして使えるツールを作った
・はてブもミニブログとしても使える
(ランダムでタイトルやURL生成するとかすれば)
>作ってみた

・作ってみた期間は1日弱ぐらい

SBMを利用したフィッシングサイト検知とその展望 -集合知セキュリティという考え方- :中山心太(NTT研究所)
http://twitter.com/tokoroten

Ust:

資料:
http://homepage3.nifty.com/toremoro/study/SBM3/nakayama.pdf

・webの進歩に比べるとセキュリティの進歩が遅い
・経済格差がフィッシン
グサイトを広げている
-アメリカ人から100ドルぶんどる途上国とか
-2007年 32億ドル
    -日本ではあまり攻撃対象になってない
-日本語や日本円ロンダリングのむずかしさ

・自然言語処理+検索エンジンによるSPAM判定
=精度92%
フィッシングサイトの文言で、正規サイトが検索エンジンで見つかるか?
という手法で検出
・SBMならもっと精度が出るのでは?
>仮説「フィッシングサイトはSBMされていないが、銀行はブックマークされてる」
>>やってみたらそうでもなかった
地銀はSBMに登録されないとか
・SBMに登録されてればSPAMでない とすればいいんじゃないか?
>>業者もまともな会社も登録するので そこからフィッシングサイトDBとかが
今よりカンタンに作れそう?

言語表現に基づくブックマークコメントの分類とフィルタリング:山田 剛一(東京電機大学 未来科学部)

Ust:

資料:
http://www.mlab.im.dendai.ac.jp/~yamada/r/sbm/

・最近SBMがアツくない もっと便利にしたい
・コメントを自動分類して便利に
・本文との共起が大きいものは「要約や引用」では?
>引用はそれでイケるけど要約は難しい
本文との共起度が高いコメントは引用ではないか?
> そうっぽい でも要約は判定が難しい
・カテゴリ分けも現状は感覚に頼っている

Livedoor clip おもしろ大改造計画 @mala
http://twitter.com/bulkneets

・イベント駆動型web
ユーザの行動に対応して動く
-PubSubHubbub
  ・デモ
リアルタイムでメッセージングを受け取る
・livedoor readerをリアルタイムに向けてコンセプト再設計
-twitterのURLなども取り込んでいく
・clip以外のサービス(ブログ書くとか)は他サービスへ
サービスをシンプルに保つ / 他サービスと連携する
・サービス統合として、
・Greacemonkeyはクライアントサイドマッシュアップ
・OAuthを使ったサーバサイドマッシュアップ
・将来的にはブックマークされたサイトへの
フィードバック機能とかがあるといいなぁ

SocialDict – 英文Webページのスマートな注釈・辞書引きシステム:江原 遥(東京大学 情報理工学系研究科 学部生)
http://twitter.com/niam

Ust:

英単語の推薦システム
英単語を推薦する:
ページ内の知らない英単語をチェック、自分の知らなそうな英単語を予測してくれる
デモ
http://tangocho.org/abomination
(他のサービス)

http://www.socialdict.com/
google app engineで実装してみたサービス

ブックマークサービス普及のためのユーザーインターフェース(UI):島津悠樹(ヤフー株式会社)

Ust:

・YAHOO利用者にブックマーク利用率を聞いたところオンラインブックマークは2%
・ブックマーク使いづらいよ
・アフォーダンス大事
・アフォーダンスの概念を取り入れた企画例

oneclip – Twitterでソーシャルブックマーク 大澤 昇平(筑波大学 学部生)
http://twitter.com/Alembert

Ust:

・Swimmie: 極力ブクマっぽいSBM http://swimmie.jp/
・ソーシャルストリームからの情報抽出
http://twib.jp/
とか dellがtwitterのマーケでうまくいってるとか
・oneclipの話
   -URL短縮&アクセス解析
-bit.lyも似たサービスだけどあちらはbotもカウントするので5倍とかになる
oneclipは正確にカウントする

閉会挨拶・今後の告知など

発表は順不同で

 

「真っ黒 scheme」  yadokarielectric

「未来言語Alloy」 酒井 政裕

「未来のハードウェア言語」 なったん

「並列に動かす何か」 @mootoh

「豆タンクさんと豊作プログラミング」 ranha

「luciferの設計コンセプトと導入予定の機能紹介」 道化師

チームラボ読書会 第7回 どうもありがとうございました。

やっと、2009/8/3 19:30-22:00第7回チームラボ読書会 議事録・Ustreamまとめに取りかかったので、公開します。

今回の読書会はまたも、ダラダラとPM22:00-ぐらいまでかかるマズい仕切りだったのを反省しています。
次回は、5分ぴったりで切り上げて、質疑応答は最後の余った時間にまとめてやるなどして、
もう少しメリハリの効いた進行を心がけて、2時間以内に終わるようにします。あと、次は金曜日で。

プレゼンされた本一覧

inoue
パタゴニア/老いぼれグリンゴ (池澤夏樹=個人編集 世界文学全集 2-8) (単行本)

KUROSAI
線の冒険

Y.F
ミタカくんと私

O.S.kimura
層・圏・トポス―現代的集合像を求めて (単行本)

tks
ナッちゃん

KOZI
THE LEXUS AND THE OLIVE TREE

nishimoto
経済ってそういうことだったのか会議

sweet chiho
ミレニアム

あまやん
アースダイバー

 

 

inoueさん

パタゴニア/老いぼれグリンゴ (池澤夏樹=個人編集 世界文学全集 2-8)
ブルース・チャトウィン カルロス・フエンテス
河出書房新社
売り上げランキング: 41731

Ustream途中で切れちゃってます ごめんなさい。

URL: http://www.ustream.tv/recorded/1919272

KUROUSAIさん

線の冒険  デザインの事件簿
松田 行正
角川学芸出版
売り上げランキング: 136791

URL: http://www.ustream.tv/recorded/1919288

 

Y.Fさん

ミタカくんと私 (新潮文庫)
銀色 夏生
新潮社
売り上げランキング: 357397

&
#160;

 

 

 

URL: http://www.ustream.tv/recorded/1919299

 

O.S.kimura さん

層・圏・トポス―現代的集合像を求めて
竹内 外史
日本評論社
売り上げランキング: 78619

URL: http://www.ustream.tv/recorded/1919317

 

tks さん

URL: http://www.ustream.tv/recorded/1919361

 

KOZI さん

The Lexus and the Olive Tree: Understanding Globalization
Thomas L. Friedman
Anchor
売り上げランキング: 25824

URL: http://www.ustream.tv/recorded/1919361

 

nishimotoさん

経済ってそういうことだったのか会議 (日経ビジ<br />
ネス人文庫)
佐藤 雅彦 竹中 平蔵
日本経済新聞社
売り上げランキング: 852

URL: http://www.ustream.tv/recorded/1919450

 

sweet chihoさん

ミレニアム1 ドラゴン・タトゥーの女 上
スティーグ・ラーソン
早川書房
売り上げランキング: 1289

URL: http://www.ustream.tv/recorded/1919491

あまやんさん

アースダイバー
アースダイバー
posted with amazlet at 09.08.18

中沢 新一
講談社
売り上げランキング: 11785

URL: http://www.ustream.tv/recorded/1919510

今後の運営のために、アンケートを行っています。
見てくれた人は是非感想をどうぞ

携帯アクセス解析