« WindRiver社がFSMLabsからRTLinuxを買収 | メイン | 有料サービス Google Apps Premier Edition »

scRUBYtのUbuntu Edgyへのインストール方法

@ITで紹介されていたWebスクレイピングツールキットのscRUBYtをUbuntu 6.10 Edgyにインストールしてみました。 

 scRUBYtはrubyで書かれたWebスクレイピングのためのツールキットです。Webスクレイピングとは既存のWebページをプログラムでいじったりデータを取り出したりすることです。同様なものにscrAPI(ruby)や BeautifulSoup(python)などがあるようです。昔html parserなどを使って自前でWebからデータを取り出したりしていたのですが、これらを使うとかなーり簡単に出来るようで目からうろこです。

とりあえず今日はUbuntu Edgyにインストール。途中エラーが出たのでメモ。

1. Ubuntuから依存パッケージのインストール
scRUBYtの記事に少し書いてあるのですが補足。ruby1.8-devも必要。

sudo aptitude install rdoc ri ruby1.8-dev libopenssl-ruby

2. gemのインストール
rubygem.orgのdownloadかrubyforgeのrubygemsからrubygems-xx.tgzをダウンロード。
tar で展開してsudo ruby setup.rbする。


3. 本体と関連ファイルのインストール 

sudo gem install mechanize
sudo gem install hpricot (mechanizeの依存関係で入るかも。選択肢ではver0.5を選択)
sudo gem install scrubyt 

mechanizeのインストール時にhoe, rake,  rubyforge, hpricot が入りますがrakeはaptにもあるのでどちらでもいいかもしれません。( ちなみにaptのものが0.7.1でgemで入るのは0.7.2)

以上でインストール完了。

関連リンク:

トラックバック

このエントリーのトラックバックURL:
http://blog.browncat.org/cgi-bin/mt/mt-tb-abc.cgi/262


コメントを投稿

(お書きになったコメントはすぐには表示されません。ご了承ください。)


About

2007年02月22日 01:08に投稿されたエントリーのページです。

ひとつ前の投稿は「WindRiver社がFSMLabsからRTLinuxを買収」です。

次の投稿は「有料サービス Google Apps Premier Edition」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。

           

カテゴリー

Powered by
Movable Type 3.36

Twitter


最近のエントリー

デル株式会社ads

注目エントリー