今日も元気にテクニカル

技術情報書きたいけど本ブログに書きたくないからこんな名前になりました。

hpricotにした。

というのは、htreeがgemで落とせないからだ!

C:\>gem install htree
Bulk updating Gem source index for: http://gems.rubyforge.org
ERROR:  While executing gem ... (Gem::GemNotFoundException)
    Could not find htree (> 0) in any repository

hpricotはmechanize導入時に一緒に入っているのでhpricotの勝ち!

…という理由だけじゃなく、いろいろ調べましたよ。けどhpricotの方がドキュメント多いし、早いらしい。

pylori*style(2006-08-27) Hpricot

HpricotというRuby用のHTMLパーサに注目していたのですが、最近ちょうど使いたい場面があったので使ってみました。まず、Hpricotはスキャン部分がC言語で書かれていて、類似のHTreeより高速だということですので両者を比べてみました。

(中略)

結果は次のようになり、たしかにHpricot(下の段)の方がかなり高速なようです。

かなり=2倍くらい。こりゃHpricotでしょ。
上記ベンチマークをしたのと同じ人がHpricotのドキュメント作ってくれてます。

pylori*style wiki - HTMLパーサ Hpricot

こういうの作る人って超偉いと思う。こっちのドキュメントも参考にしよう。

Greenbear Laboratory - Hpricot Showcase-Ja