■表示や改行が手元のファイルと若干異なるのが難点ですね。。。 以下のコードとグラフを入れただけなのですが。。。 http://www.slideshare.net/labunix/ss-15656396 ■Twilogからつぶやき数/月を取得 $ w3m -dump_source http://twilog.org/labunix/archives | \ grep "monthlist" | \ sed s/">"/"&\n"/g | \ sed s/" twilog.csv
※はてなダイヤリーには PV数を管理するページはありません。 ■2012/03/03に過去分を全取得 はてなダイヤリーのテキストモードバックアップ http://labunix.hateblo.jp/entry/2012/03/03/224721 ■2012/04/29からが有効なデータ はてなダイヤリーのRSS2からユーザの最新記事の テキストバックアップを取得する
http://labunix.hateblo.jp/entry/2012/04/29/184047 ※それでもたまにcronで失敗しているので余り正確では無い。 ■はてなダイヤリーの テキストモードバックアップから 月初更新日のPV数を取得 $ grep "閲覧回数" 2012* | \ sed s/" *閲覧回数:\|回"//g | \ sed s/":"/","/g | \ sed s/"\(201[012]\)\([01][0-9]\)\([0123][0-9]\)"/"\1\2"/g | \ awk -F\, '{if ($1==MONTH);
else{print MONTH,PV;MONTH=$1;PV=$2}} END{print MONTH,PV}' | \ sed s/"\(201[012]\)\([01][0-9]\) "/"\1\/\2\,"/g \ > hatena_daialy_pv.csv
■※はてなブログベータは 2か月分以降は有料です。 $ SURL=”http://blog.hatena.ne.jp/labunix”; \ w3m -dump “${SURL}/labunix.hateblo.jp/accesslog” | \ grep "201[012]\-[012][0-9]\-[0-3][0-9]" | \ sort -u | \ awk '{print $1,$3}' | \ sed s/"\-[0-9][0-9] "/","/g | \ awk -F\, '{if ($1==MONTH){COUNT+=$2}else {print MONTH,COUNT;MONTH=$1;COUNT=$2}} END{print MONTH,COUNT}' | \ sed s/"\-"/"\/"/g > hatena_b.csv; unset SURL