hpricotにした。
というのは、htreeがgemで落とせないからだ!
C:\>gem install htree Bulk updating Gem source index for: http://gems.rubyforge.org ERROR: While executing gem ... (Gem::GemNotFoundException) Could not find htree (> 0) in any repository
hpricotはmechanize導入時に一緒に入っているのでhpricotの勝ち!
…という理由だけじゃなく、いろいろ調べましたよ。けどhpricotの方がドキュメント多いし、早いらしい。
pylori*style(2006-08-27) Hpricot
HpricotというRuby用のHTMLパーサに注目していたのですが、最近ちょうど使いたい場面があったので使ってみました。まず、Hpricotはスキャン部分がC言語で書かれていて、類似のHTreeより高速だということですので両者を比べてみました。
(中略)
結果は次のようになり、たしかにHpricot(下の段)の方がかなり高速なようです。
かなり=2倍くらい。こりゃHpricotでしょ。
上記ベンチマークをしたのと同じ人がHpricotのドキュメント作ってくれてます。
pylori*style wiki - HTMLパーサ Hpricot
こういうの作る人って超偉いと思う。こっちのドキュメントも参考にしよう。