今日も元気にテクニカル

技術情報書きたいけど本ブログに書きたくないからこんな名前になりました。

hpricot

日本語URLを含む「こえ部」のタグページを解析す

こえ部(http://koebu.com)で投稿数が2以上のお題を抽出したいと考えた。最初はこんな感じでやろうとしたが… require 'mechanize' url = 'http://koebu.com/topic/tag/男声向け' agent = WWW::Mechanize.new page = agent.get(url) puts page…

(小ネタ続き)取得した人狼BBS参加者リストを解析

参加者IDをこんな感じでテキストファイルに保存。 =====501村===== master knight ・ ・ ・ seena totoro =====502村===== master yamadayama ・ ・ ・ bdheki turugiこれを以下のスクリプトで解析 require 'benchmark' puts Benchmark.measure { fi…

(小ネタ)Hpricotを使って人狼BBSの参加者リストを作成する。

人狼BBSのアクティブユーザー、ヘビーユーザーの割合が知りたかったので 参加者リストを取得しIDを抜き出すスクリプトを作成しました。 require 'hpricot' require 'open-uri' #uptoメソッドetcを使用して繰り返し実行(今はしない) #501.upt…