labunix's blog

labunixのラボUnix

SlideShareにアップロードしてみた。

 

■表示や改行が手元のファイルと若干異なるのが難点ですね。。。
 以下のコードとグラフを入れただけなのですが。。。

 http://www.slideshare.net/labunix/ss-15656396

■Twilogからつぶやき数/月を取得

$ w3m -dump_source http://twilog.org/labunix/archives | \
  grep "monthlist" | \
  sed s/">"/"&\n"/g | \
  sed s/" twilog.csv

f:id:labunix:20121216192015p:plain

はてなダイヤリーには
 PV数を管理するページはありません。

■2012/03/03に過去分を全取得

 はてなダイヤリーのテキストモードバックアップ
 http://labunix.hateblo.jp/entry/2012/03/03/224721

■2012/04/29からが有効なデータ

 はてなダイヤリーのRSS2からユーザの最新記事の
 テキストバックアップを取得する
 http://labunix.hateblo.jp/entry/2012/04/29/184047 ※それでもたまにcronで失敗しているので余り正確では無い。 ■はてなダイヤリーの  テキストモードバックアップから  月初更新日のPV数を取得 $ grep "閲覧回数" 2012* | \ sed s/" *閲覧回数:\|回"//g | \ sed s/":"/","/g | \ sed s/"\(201[012]\)\([01][0-9]\)\([0123][0-9]\)"/"\1\2"/g | \ awk -F\, '{if ($1==MONTH);
else{print MONTH,PV;MONTH=$1;PV=$2}} END{print MONTH,PV}' | \ sed s/"\(201[012]\)\([01][0-9]\) "/"\1\/\2\,"/g \ > hatena_daialy_pv.csv

f:id:labunix:20121216192029p:plain

■※はてなブログベータは
 2か月分以降は有料です。

$ SURL=”http://blog.hatena.ne.jp/labunix”; \
   w3m -dump “${SURL}/labunix.hateblo.jp/accesslog” | \
   grep "201[012]\-[012][0-9]\-[0-3][0-9]" | \
   sort -u | \
   awk '{print $1,$3}' | \
   sed s/"\-[0-9][0-9] "/","/g | \
   awk -F\, '{if ($1==MONTH){COUNT+=$2}else
     {print MONTH,COUNT;MONTH=$1;COUNT=$2}}
     END{print MONTH,COUNT}' | \
    sed s/"\-"/"\/"/g > hatena_b.csv; unset SURL

f:id:labunix:20121216192034p:plain