Blogの最近のブログ記事

MT3.2になってから、コメントスパム、トラックバックスパムは SpamLookup プラグインで楽させてもらってます。 最初のスパムをつぶしてしまえば、Junk判定されたコメントの メールアドレスやコメント本文に 含まれる URL を覚えていいて、次回のスパムにJunkなメールアドレスやURLを含む コメントやトラックバックは意識しなくてもどんどんJunkコメント/トラックバックとして処理してくれてます。

で、それぞれのSpamLookup plugin がJunkコメント/トラックバックとして処理するところを みんなで共有しようという仕組みを miyagawa さんが提供してくれています。ぐれいと。

Bulkfeeds では、ボランティアによる SPAM サイト登録 と、自作の SPAM フィルタによるブラックリストの強化を行ってきましたが、API による公開の準備ができたのでお知らせします。

今回の API および機能拡充は以下のリストから構成されます。

1. DNS によるブラックリスト問い合わせ API の公開(ベータ)
2. Movable Type の JunkFilter フレームワークと連携した自動登録
3. REST による ブラックリストへの URL 登録 API の公開

この「Junkコメント/トラックバックとして処理」のSpamLookupが自動的に やってくれている部分にHookをかけて、rbl.bulkfeeds.netにスパムのターゲットサイトの ドメインを集める部分と、 集めたターゲットサイトをドメインBlackListをDNS問い合わせに対応する部分で スパムコメントをエンドユーザ側から包囲してしまうわけです。豪快にして合理的。

もう http://www.gaycoock.com とか書いたコメントやトラックバックは投稿できないですよ。

rocketboom logo
ROCKETBOOM は月~金の毎朝9時(EST)に公開される3分間のNY発の動画ブログ(vlog)です。 TV番組とはとは違うvlogの道を進んでおります。 Rocketboomは民生品のビデオとノートPCと二つのライトと地図だけで 余計なコストをかけずに作られているそうです。 詳しくは about でご確認を。

そのROCKETBOOMでちょっと前に面白いことがありました。 マイクロソフト社員のBlogとして有名(?)な Robert Scoble氏が 書いた3月21日のエントリー I've been Rocketboomed. Have you? で 「Rocketboom してから毎日が始まる」とかそんなことを書いたのですが、 次の日のRocketboomで「Robert Scoble も Rocketboom のファン」というのがRocketbloomされたのです。 しかもそのエントリーに Robert Scoble氏がコメントをつけるって感じで。

ちなみに、私が最初にこのサイトの存在を知ったのはFlickr のビデオクリップ版こと vimeo をローンチした Jakob Lodwick氏の インタビューhttp://del.icio.us/jakobで見つけた時でした。

米Yahoo!Flickrを買収と 正式にアナウンスがあったようです。

今後の展開については miyagawaさんのエントリーnaoyaさんのエントリーに あるように、「Yahoo が Flickr の良いところをどんどん取り入れていく。」という ことのようです。 2005年は Yahoo が提供してくれる「いじりたくなるもの」に目が離せないですね。

で、ちょっとだけ俯瞰して眺めると Yahoo エバンジェリスト Jeremy Zawodny 氏 がやっていることの影響、効果がとても大きくなっているように見えます。 この件についての、Jeremy氏のブログに対する コメントには 「This is a smart acquisition. Congratulations to both parties!」 なんて書いている人までいる。 「Bloglines と Ask Jeeves」の時とは明らかに違う。 個人的にはエバンジェリスト Jeremy 氏の存在とそのメッセージが大きな違いだと思う。

Jeremy 氏はBlogによる情報発信のみならず、 Yahoo! Web Services APIの公開Developer Network Blogでも積極的に「ネタ」を提供し続けることで geekからの信頼度を確実なものにしていっている。 geekは信頼をもってBlogに書き、情報は口コミネットワークを伝播する。 geekはhackしてAPIを使った新しいアプリケーションを作りながら Yahooに対して親近感を抱くでしょう。 そんなgeekがYahooで働くようになったとしたら、 こんな効率のいいエンジニア獲得方法は無いんじゃない? しかも、APIを使った新しいアプリケーションが geek以外のユーザにも広まるとしたら、 こんな効率のいい広報の仕方は無いんじゃない?

もし、会社に社外からも注目されるエンジニアがいるのであれば 業界誌に記事を書いてもらったり、セミナー等で話をしてもらうのもいいけど、 Jeremy 氏のような役割を担ってもらうことを考えてみてもいいかも。 キーワードは「いかにして外からの信頼度を確保するか」です。 信頼度が高ければ、メッセージ伝播のコストが減るはずですよね。

ここ最近なんだか急に trackback spam が多くなってません? 反面、comment spam が減っているような気もしますが。 いままでspam対策はとくにやっていなくて、 気づいたときに「しょうがないな。ったく。」とか削除してたんですけど、 mt-tbping-dsbl.pl を試したこともあって、もうちょっとまじめに対策しようと思い立ちました。

第一歩として、ちょっとスパマーの側に立って trackback spam の目的から その目的のためにどうして trackback spam なのか考えてみた。

  1. のっぴきならない理由であるサイトに訪れる人を増やしたい。
  2. そのためにはGoogleのPageRankをあげて検索結果の上位に 表示させたい。
  3. じゃ、被リンク数を増やそう。単純にリンクたどる人も増やせるし。
  4. trackback は簡単に勝手に人のサイトにリンクを貼れるらしい
  5. trackback 先サイトは weblogUpdate ping をチェックしたり tecnorati や bloglines といったところの toplink で 効率よく、しかも悪びれることなく取得できるじゃん
  6. まあ当然自分のISPからtrackback ping したんじゃアカウント停止に なるだろうから Zombie Cluster つかってバンバン打ちまくるか

短絡的に考えるとこんな感じか。スパマーにとっては便利過ぎな状況。

trackback 送信元のIPアドレスを変えるのは Zombie Cluster が 砂漠のように乾いてしまわない限り苦になる作業じゃなさそう。 weblogUpdate ping もいわば合法的にとってこれるし。 で、結局のところ誘導先を変更するのが相手にとって一番コストが かかる。 つまり、誘導先サイトのURLのシグネチャをとっておいて comment とか trackback とかでスパム判定すればOKじゃない?

とかって思っていたら MT-Blacklistてんこ盛り に同じ様なことが含まれているっぽいですね。 次回は MT-Blacklist について調べつつ、導入するかどうか考えてます。 っとか言ってる間に trackback spam が!削除!ビシッ!

私がいま遭遇している現象の話。

  1. BloglinesでBlogとか ザックザックと読んで
  2. 面白そうなページを発見したら
  3. del.icio.usというソーシャルブックマークにtagして小さなコメントつけたりして
  4. http://www.bloglines.com/citationsで そのエントリーにリンクしてる他の人のエントリー読んで
  5. そこでまた面白そうなページを発見したら(★に戻る) 

この3~5の無限ループからなかなか抜けられない。

ブックマークして満足しちゃうんで、Blog書くときには ブックマークしたとき以上のモチベーションが必要になっちゃって 自分でその敷居を越えられない。

で、こんなネタはブックマークできないのでBloggingしてみました、という話

はてなブックマーク・フォトライフキーワード

はてなの新しいサービス「はてなブックマーク」のベータ版開始と、フォトライフでもキーワード機能が追加されました。

キーワードを tag と置き換えれば 「はてなブックマーク=del.icio.us」 「フォトライフ=Flikcr」という形が見えますね。 他のBlog系サービスを尻目にこのようなサービスを始められるのは 「はてなキーワード」という大きな資産があるからでしょう。

Wired の記事ネット世界をタグで分類する「フォークソノミー」を読んで tag付けが面倒臭い と言っている人もいますが、 「はてなブックマーク」はブックマークするときにカテゴリとキーワードを自動判定してくれますし、 「はてなフォトライフ」は画像をアップロードした時のタイトルからキーワードを自動判定してくれます。

しかし、「はてなキーワード」を利用することによる制限も存在します。 del.icio.us や Flickr ではユーザが勝手にキーワード(=tag) を選ぶことが出来るので「folksonomy」というような 新しい単語であってもネットワークが自然発生しますが、 はてなの場合はキーワードを作成するという手順を踏まなくてはいけません。

なにはともあれ、注目の集まっている技術を そのまま提供するのではなく、あくまで「はてな」らしくサービスをベータリリースするところが、「はてな」の魅力だなぁと。

新しい携帯電話を買うのはとてもわくわくするものです。 けど、もしその携帯電話の宣伝されていた機能が使えなかったら、 あなたはどんな行動を取りますか?

2chにスレ立っているはずのスレに書き込みに行くかもしれないし、 何人かのブロガーは「買ったけど、Bluetooth動かないよ。まじ?詐欺?」とか 自分のブログに書くかもしれない。

ブログコミュニティ(blogosphere)に企業は注意する必要がある、という話が Financial Times の記事に載っている。 (via Social Media: Bloggers send warning shot to corporate America )

Financial Timesにある Bloggers send a warning shot to corporate America という記事によれば、全米第2位の携帯キャリア Verizon Wireless が モトローラ製新型携帯電話v710を 宣伝文句と異なりBluetoothを使えない状態で販売し 集団訴訟(class action lawsuit)を起されたそうだ。 (実際は2005年1月くらいに slashdotted されてたもよう。)

この記事の中で TechDirt の Mike 氏の発言が以下のように書かれている。

Mike Masnick, chief executive of Techdirt, one such firm, most companies are oblivious to blogs and those that are aware do not know how to respond. He believes the best strategy is to engage bloggers openly and honestly in their realm. Any whiff of insincerity will be picked up and turned against a company.

企業はブログコミュニティに誠実さをアピールできるでしょうか?

そうそう、 v710 を手にした人がどんな post しているのかを 知るのは簡単ですね。 technorati にあるはずの v710 タグ http://www.technorati.com/tag/v710 を見に行くだけです。:)

Napsterization : Ask Jeeves Buys Bloglines

That's the scoop. Ask Jeeves is integrating Bloglines into their search system

たしかに、2月2日生まれ、できたてほやほやのAsk Jeeves の Blogを見ると、上のSearch Blogsボタンによる入力フォームと サイドバーの Top Blogs Most Popular Blog Links へのリンクは 直接 Bloglines へリンクしていますね。

当事者のMark Fletcher(Bloglines CEO) は何か書いているかなと おもってブログを見に行ったのですが、 のんきに「デジカメ買ったからネコちゃんを撮影しる」 的な Cat Blogging をしていますね。ぉぃ。 「志村、後ろ!後ろ!」。

で、元のNapsterizationの記事を読むと Bloglines の優位性は使うソフトやバージョンによって微妙に 違うFeedを一つのデータベースに格納する技術、 そしてそのデータベースを運用する技術にあると書いています。 たしかに、めったなことでは解析エラーにならないFeedを取得する技術と、 OracleMySQL といったRDBMSではなく Sleepycat Software 社 の Berkeley DB を使っているあたりが 技術的に気になるところです。

とはいっても、この噂を聞いたときに Bloglines ヘビーユーザとしての 第一印象はAsk Jeevesで大丈夫かなぁという漫然とした不安でした。 Jeeves おじさんとは親しくないものですから。

追記 2005年2月8日 17:50 (JST)
Mark Fletcher(Bloglines CEO)のブログ Nobody Expects The Bloglines Askquisition! にて「噂は本当だよ」とあります。 Ask Jeeves は買収を持ちかけた他の会社と違って Bloglines ブランドの継続を支持してくれたので、ともかいてますね。 「実際の話、多くのAskの経営陣だってBloglinesのユーザなんだよ」 とか書いているあたりに、「これからもBloglinesを応援するよ。もう志村とか言わない。」と誓うのでした。

たつをさんWhat You'll Wish You'd Knownで書いていた

これを読んだ人たちがどの部分に興味を持つかに興味がある。 誰がどの部分をブログで引用したかのリストがあると面白いかも。

たしかに面白そうだったので、 ブログで引用された部分を色別表示 してみました。

これを作成したプログラムですが、

ってな感じです。引用したブログは DHTML を使ってバルーンヘルプ風に 出してみました。

広い範囲を引用した人が狭い範囲を引用した人を塗りつぶしちゃう。 そもそもバルーンヘルプの挙動がいまいち。 もうちょっとゆるいマッチにしないと、blockquote 内でいろいろやっている ブログの引用部分は表示されない。 という悪い点はあるものの、少しは面白さが実感できたので良しとします。

perl のゴリゴリしたコードは以下

MTBanASCII SPAMを捕まえるの図

miyagawa さんが作ったMTBanASCII (SPAMに多いASCII文字列だけのコメントの場合には そのコメントを保留にするようにしたり、 そもそもコメントとして処理しないようにすることのできるMTプラグイン)で SPAMを捕獲してくれました。

このMTBanASCII のように MT3 では CommentFilter というフックを使って コメントの内容を判断して”表示”、”保留”、”削除”を選択するプラグインを 簡単に作成できるように作られているんですね。

これを使えば SpamAssasisn のような ベイジアン・フィルタで学習型スパム対策や GeoIPを使ってコメント送信元IPアドレスを国別に制御とかもできそうです。

できそうなのはわかるけど作るのは面倒。 なので簡単なものを作ってみました。 コメントの末尾に必ず〇〇をつける MT-Plugin mt-autoadd.pl です。 このまま plugins ディレクトリに放り込んでください。 コメントの末尾に「 全裸で。」と自動的に付け加えてくれます。

このプラグインを利用することによって生じる一切の紛争に対して 私は責任もてませんけど。。 え?mt-plugins.org には当然submitしてませんよ。。

del.icio.us の感想

| コメント(0)

ソーシャルブックマークマネージャ del.icio.us というのを最近使っています。デリシャス。 私のブックマークは del.icio.us/sekimuraで 見ることができます。

Going My Way: Social Bookmark Manager del.icio.us では以下のように紹介されています。

Bookmarkなのにフォルダではなくタグで管理するというのが面白い
他の人のタグを参考にネタを探す際に便利そう

私が使ってみた感じでは面白いと思っているのは以下

  • 同じページをブックマークしているユーザがわかる 例1
  • タグをつかって自分のブックマークをあとから眺めるのに便利 例2
  • すべてのユーザのブックマークをタグで串刺しして眺めてネタ探し 例3

また、 del.icio.us APIドキュメント Perl モジュール Net::Delicious などの情報もあるので、Hackするのも楽しそうです。

rel="nofollow" まとめ

| コメント(0)

Blog の comment を見ていると Blog のエントリとは関係のない 「おいらサイトじゃの激安な薬を買えますよ!」、 「無料でインターネットカジノを楽しむならここ!」といったリンクが貼られているのをよく目にします。 これは comment spam といわれていて 英語圏では特に深刻化しています。

BlogサービスやBlogツールはその対応を迫られ、例えばココログのベースとなっている MovableType は先日どうやって spam と戦うかというドキュメントを発表しています。

そんな状況の中で、Google は rel="nofollow" という属性がついた auchor タグ (例 <a href="http://www.example.com/" rel="nofollow"/> )の場合は PageRank の評価には含まないというアナウンスを行いました。

このアナウンスではコンテンツツールのコミュニティに対して対応をお願いするとともに LiveJournal, Scripting News, Six Apart, Blogger, WordPress, Flickr, Buzznet, blojsom, Blosxom, MSN Spaces といった Blog ツール、Blog サービスとはすでに、この nofollow について 同意したことも発表されています。

日本語の情報としては SEMリサーチさんのところでは 「リンク分析対象外にでき(中略)スパマーの経済的インセンチィブを低下」と nofollow が スパマーに与える影響を解説されています。 まとめサイトとしては [eN] 「nofollow」でブログのスパムは減少するか? が非常に参考になります。そして、

ただ単に見せることだけが目的のトラックバックは減らないかも知れませんね。

という一文には激しく同意します。

like RSS Rolling というのを作りました(正確には「作ってました」だけど)。 特徴は "n" "p" キーによってエントリーの表示がパラパラと切り替わるところです。 Emacs で Mew という MUA を以前使っていたのですが、その UI にあわせて RSSのデータを読みたいなぁと思ったのがきっかけでした。

RssRolling とは

お気に入りのウェブログなどを巡回してRSSを取得し、最新記事順に並び替えて表示しています。現在30分毎に更新しています。

という Naoya Ito さん によって公開されているものです。 like RSS Rolling でもRSSを巡回してデータを保存し、時系列で並べて データをHTMLに整形して出力と裏側でやっていることは変わらなくて、 gmail とか orkut とか使ってみて、Webアプリケーションも JavaScript 使って表示の UI を少しだけ工夫すると面白いかもという実験をしてみたのでした。

like RSS Rolling の実装は「HTML一気読みで表示をJavaScriptで制御」 というありがちなやつです。綺麗に書ききれてはいないのですが getkey.js というJavaScriptにUIの処理全体がありますので興味のある方は 参考にしてください。ま、IE と Mozilla の違いにはうんざりです。

本当はRSSリーダーを作ろうとしてたんですけど。。

AUのボイスメールでAudioBlog するにはどうすればいいのか考えた。 今回はLinuxでボイスメールのファイル形式qcpからWAVに変換するために 必要な情報をまとめておきます。

Audioblog.com

Welcome to Audioblog.com Audioblog.com is the powerful and easy-to-use audio publishing service that puts your voice in your weblog or online journal.

BloggerCon は盛り上がっているんでしょうか。海外のごく一部ではPodcasting関連の話題が 異常な盛り上がりを見せている今日この頃ですが、皆さんいかがお過ごしでしょうか。アー、アー。こちら首都東京。 本日は晴天ナリ。

Audioblog.com は BlogRecorder なるツールでPCのマイクの音声から、MP3等の音声ファイルを ボイスレコーダに録音する並の手軽さで作成してくれます。 しかも、自分のサイトにその音声ファイルを含む記事を投稿してくれたりもする、上記一部の Podcasting な人々にとってはとっても便利なサービスです。あ、無料じゃないっすよ 4.95ドル/月

About Me

このブログは Masayoshi Sekimura によって書かれています。現在はサンフランシスコ市内に在住し Six Apart, Ltd. でエンジニアをしています。 このブログ以外にオンラインでやっている事は qootas.org/sekimura/ で見ることができます。 メールは sekimura+blog@gmail.com までどうぞ。

このアーカイブについて

このページには、過去に書かれたブログ記事のうちBlogカテゴリに属しているものが含まれています。

前のカテゴリはArtです。

次のカテゴリはBookです。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ

Powered by Movable Type 4.26