ムチャクチャ面白いイベントでした。会場もよく、雰囲気もコアながらそれほど浮世離れせず、使い回しのプレゼンもなく、ガチな感じが強くてよかったです。
プレゼン資料置き場
http://homepage3.nifty.com/toremoro/study/SBM3.html
■プログラム
エコメンデーション 講師:佐々木 祥 ,上村 理(東京工業大学 博士課程、修士課程)
SBMの推薦アルゴリズム ~はてなブックマークのレコメンド(関連エントリ)の仕組み~ 岡野原大輔 PFI 特別研究員
SBMはミニブログです。: 福冨 諭(Webプログラマ) SBM研究会
SBMを利用したフィッシングサイト検知とその展望 -集合知セキュリティという考え方- :中山心太(NTT研究所)
言語表現に基づくブックマークコメントの分類とフィルタリング:山田 剛一(東京電機大学 未来科学部)
Livedoor clip おもしろ大改造計画 @mala
SocialDict – 英文Webページのスマートな注釈・辞書引きシステム:江原 遥(東京大学 情報理工学系研究科 学部生)
ブックマークサービス普及のためのユーザーインターフェース(UI):島津悠樹(ヤフー株式会社)
oneclip – Twitterでソーシャルブックマーク 大澤 昇平(筑波大学 学部生)
■発表
エコメンデーション 講師:佐々木 祥 ,上村 理(東京工業大学 博士課程、修士課程)
http://twitter.com/brnw
http://twitter.com/o_kamimu
Ust:
資料:
http://homepage3.nifty.com/toremoro/study/SBM3/kamimura.pdf
・SBMを利用したレコメンデーション
・レコメンデーションの基本的なアルゴリズム(協調フィルタ)
・レコメンデーションの計算機コストを下げる=エコメンデーション
・全員のプロファイルでなく、代表ユーザ(似ているプロファイル)を使えば、削減できる
実装は以下の人
・代表的、典型的なユーザを分析することで計算量を削減
>問題点 サービスによって典型的が分析できたりできなかったりする
>汎用的を目指してプロファイル決定木を構築
・テストしたところユーザ50人の場合で25%削減
・精度も問題なしの模様
>ただし、もっと大きいデータセットでもっと効果が出るかは、実装上もう少し工夫が必要
SBMの推薦アルゴリズム ~はてなブックマークのレコメンド(関連エントリ)の仕組み~ 岡野原大輔 PFI 特別研究員
http://twitter.com/hillbig
資料:
http://www-tsujii.is.s.u-tokyo.ac.jp/~hillbig/papers/sbm3_okanohara.pdf
参考:naoya氏のはてブ資料
http://bit.ly/zSpZg
Ust:
・はてなブックマークのレコメンド
・協調フィルタ
・開発合宿を行ったところ、タグを用いたモノが精度がよかった
・基本タグだけでやっている
(一部のものはタグ以外も使ってる)
・開発は1台 索引は圧縮している C++で開発
・google sets
(google labsで提供中の推薦エンジン。japan,USAとか投げると
「国じゃね?」とか返してくれる)をベイジアンフィルタで行う
Thrift
・数式全開タイム
・積分消去
・シータ
・アイテム数が多いので圧縮したい はてブの対象アイテムは1600万
-整数列の効果的な格納方法
-推薦に影響が少ない情報は捨てる
-要約する(スカッシング,クラスタリング)
-サンプリング+補正
・LSH使った場合 2000万アイテムに対して 4784ms > 2.56msに
locality sensitive hash
一台で数千万~数億に対応可能
・レコメンドは見せ方が課題
・LSH選んだ理由
・速度
・チューニングのしやすさ
・コサイン距離以外の実装方法は試してない
(hotateの距離計算は勝手に作ったのでコサイン距離じゃないけど)
SBMはミニブログです。: 福冨 諭(Webプログラマ) SBM研究会
Ust:
資料:
http://homepage3.nifty.com/toremoro/study/SBM3/fukutomi.pdf
・SBMとtwitterはそんなにデータの形式が変わらない
・SBMのほうがデータの蓄積/検索はしやすい
・twitterで過去の検索ができなかったり、検索機能が弱いのが腹が立つ
・SBMをミニブログとして使えるツールを作った
・はてブもミニブログとしても使える
(ランダムでタイトルやURL生成するとかすれば)
>作ってみた
・作ってみた期間は1日弱ぐらい
SBMを利用したフィッシングサイト検知とその展望 -集合知セキュリティという考え方- :中山心太(NTT研究所)
http://twitter.com/tokoroten
Ust:
資料:
http://homepage3.nifty.com/toremoro/study/SBM3/nakayama.pdf
・webの進歩に比べるとセキュリティの進歩が遅い
・経済格差がフィッシン
グサイトを広げている
-アメリカ人から100ドルぶんどる途上国とか
-2007年 32億ドル
-日本ではあまり攻撃対象になってない
-日本語や日本円ロンダリングのむずかしさ
・自然言語処理+検索エンジンによるSPAM判定
=精度92%
フィッシングサイトの文言で、正規サイトが検索エンジンで見つかるか?
という手法で検出
・SBMならもっと精度が出るのでは?
>仮説「フィッシングサイトはSBMされていないが、銀行はブックマークされてる」
>>やってみたらそうでもなかった
地銀はSBMに登録されないとか
・SBMに登録されてればSPAMでない とすればいいんじゃないか?
>>業者もまともな会社も登録するので そこからフィッシングサイトDBとかが
今よりカンタンに作れそう?
言語表現に基づくブックマークコメントの分類とフィルタリング:山田 剛一(東京電機大学 未来科学部)
Ust:
資料:
http://www.mlab.im.dendai.ac.jp/~yamada/r/sbm/
・最近SBMがアツくない もっと便利にしたい
・コメントを自動分類して便利に
・本文との共起が大きいものは「要約や引用」では?
>引用はそれでイケるけど要約は難しい
本文との共起度が高いコメントは引用ではないか?
> そうっぽい でも要約は判定が難しい
・カテゴリ分けも現状は感覚に頼っている
Livedoor clip おもしろ大改造計画 @mala
http://twitter.com/bulkneets
・イベント駆動型web
ユーザの行動に対応して動く
-PubSubHubbub
・デモ
リアルタイムでメッセージングを受け取る
・livedoor readerをリアルタイムに向けてコンセプト再設計
-twitterのURLなども取り込んでいく
・clip以外のサービス(ブログ書くとか)は他サービスへ
サービスをシンプルに保つ / 他サービスと連携する
・サービス統合として、
・Greacemonkeyはクライアントサイドマッシュアップ
・OAuthを使ったサーバサイドマッシュアップ
・将来的にはブックマークされたサイトへの
フィードバック機能とかがあるといいなぁ
SocialDict – 英文Webページのスマートな注釈・辞書引きシステム:江原 遥(東京大学 情報理工学系研究科 学部生)
http://twitter.com/niam
Ust:
英単語の推薦システム
英単語を推薦する:
ページ内の知らない英単語をチェック、自分の知らなそうな英単語を予測してくれる
デモ
http://tangocho.org/abomination
(他のサービス)
http://www.socialdict.com/
google app engineで実装してみたサービス
ブックマークサービス普及のためのユーザーインターフェース(UI):島津悠樹(ヤフー株式会社)
Ust:
・YAHOO利用者にブックマーク利用率を聞いたところオンラインブックマークは2%
・ブックマーク使いづらいよ
・アフォーダンス大事
・アフォーダンスの概念を取り入れた企画例
oneclip – Twitterでソーシャルブックマーク 大澤 昇平(筑波大学 学部生)
http://twitter.com/Alembert
Ust:
・Swimmie: 極力ブクマっぽいSBM http://swimmie.jp/
・ソーシャルストリームからの情報抽出
http://twib.jp/
とか dellがtwitterのマーケでうまくいってるとか
・oneclipの話
-URL短縮&アクセス解析
-bit.lyも似たサービスだけどあちらはbotもカウントするので5倍とかになる
oneclipは正確にカウントする
閉会挨拶・今後の告知など








