佐々木拓郎 『データを集める技術 最速で作るスクレイピング&クローラー』 - sekibang 3.0

sekibang 3.0

文化的消費活動の日記

佐々木拓郎 『データを集める技術 最速で作るスクレイピング&クローラー』

 

データを集める技術 最速で作るスクレイピング&クローラー (Informatics&IDEA)

データを集める技術 最速で作るスクレイピング&クローラー (Informatics&IDEA)

 

 ひさしぶりに技術書を。スクレイピング(= Webサイトから情報を抽出すること)とクローラー(それを自動でやってくれるプログラム)をVBAなど会社勤めの非プログラマーが使える「普通の道具」を使って作る、という本。仕事で定期的にWebサイトを見にいって、アレコレするルーチンワークがあり、これでなんか効率化できるかなぁ、と思って買ってみた。結果、あ、これ、今解決したいことには使えないわ、ということが5分ぐらいで判明したんだけれど、そもそも、VBAIEを操作できる、っつー本書の基本的な部分についてまったく知らなかったので勉強になった。

相当な初心者目線で書かれている。ExcelVBAの開発タブを表示するには、という話から始まるぐらいなので、そもそもWebサイトのHTMLがどのようにして書かれているのかがわからない人にも充分理解できるレベルとなっている。親切。親切すぎて、そこそこVBAを書いたことがある、という人にとっては不要な内容も含まれているので、そこは不満になるかも。

昔、PythonとGAEを使って成田空港にある銀行の為替レートを拾ってきてDBに溜め込む、みたいなプログラムを動かしていたことを思い出した。よくわからずに適当に書いてたので、こういう本を読んでスクレイピングの基礎的な部分を理解しておけば良かったな、と今になっては思う(いま、プログラマーでもシステムエンジニアでもないから、技術を身につけておく必要性もないんだけれど)。