twitter利用者について調べた(2008/09)

twitterユーザがプロフィールのWeb欄に記入しているURLを集計しました。データの取得期間は9/21〜9/22で、64784アカウント分を調査、そのうち、日本語を使用していると思われる、46775アカウントでの集計です。
左から、

cluster
Web欄のURLを分類したもの(僕が発明した言葉です)。未記入のものは「未記入」、その後各サービスに固有の文字列で分類(例:"blogspot"が含まれていれば「Blogger」)、分類されずに残ったもののうち、http://abc.efg あるいは http://abc.efg/ となっているものは「独自ドメイン」、 http://abc.efg/hij http://abc.efg/hij/ などは「その他」に含めています。
id
クラスターに分類されたアカウント
following
あなたがフォロー数の平均
followers
あなたをフォロー数の平均
updates
これまでの投稿数の平均
private
プライベートとなっている割合の百分率
active
2008/09に入ってから発言がある割合の百分率

です。
計(平均)は、全対象ユーザの計、平均。

cluster  id  following  followers  updates  private  active 
未記入 27480 62 24 434 19.4% 33%
独自ドメイン 5573 84 93 1220 14.9% 58.2%
はてな 2973 117 127 1869 8.5% 71.4%
その他 2787 83 91 1381 12.1% 62.4%
iddy 1015 218 230 4762 8.7% 84.1%
necoったー 993 7 14 1728 0.2% 28.2%
FC2 937 56 58 922 5.7% 66.1%
Blogger 494 69 64 899 18.8% 58.9%
mixi 470 54 54 807 11.1% 51.7%
livedoor 391 71 83 1519 5.9% 62.7%
tumblr 387 142 145 2397 13.7% 68.5%
JUGEM 294 37 44 938 12.6% 56.8%
nifty 272 47 60 1250 7.4% 64.3%
twitter 270 193 194 4098 13% 55.2%
アメブロ 242 36 34 356 9.5% 52.5%
Seesaa 228 44 52 931 4.8% 63.2%
MySpace 200 47 46 630 28.5% 43.5%
sakura 186 53 63 1169 8.1% 74.2%
flickr 166 82 95 1801 30.1% 55.4%
excite 149 42 35 432 12.1% 54.4%
Vox 142 67 96 1166 13.4% 67.6%
pixiv 136 48 53 1220 15.4% 80.1%
shinobi 118 33 34 727 6.8% 65.3%
アバウトミー 117 174 190 3720 5.1% 64.1%
geocities 111 72 76 1230 8.1% 70.3%
goo 92 42 49 1864 13% 43.5%
Last.fm 85 58 61 1123 8.2% 69.4%
ソネット 76 19 24 496 6.6% 64.5%
infoseek 62 46 55 1403 6.5% 64.5%
FriendFeed 61 232 219 3306 8.2% 82%
WordPress 58 89 105 1924 46.6% 46.6%
ニコニコ動画 55 82 135 4214 5.5% 83.6%
ヤプログ 54 22 29 621 13% 53.7%
Yahoo!ブログ 52 28 59 1982 7.7% 53.8%
mac 49 29 37 561 12.2% 61.2%
計(平均) 46775 73 53 913 16.1% 44.8%

iddy勢が強い。そのほかのプロフィールサービス利用者も、発言数やactive率が高いように思います。

上の表でactive率となっているのは、九月にはいってから呟きがあったユーザの比率です。同じ表をactiveユーザのみでも作成してみました。activeなユーザかどうかは、最後のつぶやきの日付を見ているので、つぶやきを非公開にしているユーザも除かれています。

cluster  id  following  followers  updates 
未記入 9065 34 35 741
独自ドメイン 3246 92 112 1592
はてな 2122 138 155 2243
その他 1738 102 117 1739
iddy 854 228 243 4806
FC2 619 72 72 1185
Blogger 291 77 77 878
necoったー 280 17 23 2603
tumblr 265 162 169 2696
livedoor 245 99 118 2139
mixi 243 73 72 1240
nifty 175 61 79 1759
JUGEM 167 52 59 1279
twitter 149 223 256 5984
Seesaa 144 50 61 1330
sakura 138 63 74 1052
アメブロ 127 44 37 461
pixiv 109 49 53 891
Vox 96 67 108 1416
flickr 92 96 119 1881
MySpace 87 67 61 990
excite 81 59 49 590
geocities 78 97 101 1611
shinobi 77 37 38 684
アバウトミー 75 227 252 5334
Last.fm 59 74 79 1459
FriendFeed 50 216 213 3441
ソネット 49 20 24 656
ニコニコ動画 46 89 151 4958
infoseek 40 57 69 1949
goo 40 73 82 3702
mac 30 34 46 806
ヤプログ 29 28 43 690
Yahoo!ブログ 28 38 93 3500
WordPress 27 81 113 1924
計(平均) 20961 76 85 1474

URL欄を記入しているactiveなユーザのうち、18%弱がはてなのURLを記入しています。
意外なのは、そもそもアクティヴなユーザが2万人強しかいないことです。
IDの収集は、まずいくつかのIDを指定しリストへ追加、次に、リストの頭から順番に、そのユーザがfollowingしているユーザをリストへ追加、というのを、ほぼリストの増加が止まるまで繰り返し行いました。その際、ページ内に表示された発言をみて、ひらがな、もしくはカタカナが一文字も使用されていない場合は日本語利用者ではないと判断してfollowingの調査を止めています。また、つぶやきを非公開にしている場合も日本語利用者であるか判断出来ないため、following の調査をしていませんが、一つ目の表の集計には含めています。
グラフを描くなら3D円グラフが最強とつい最近まで信じていたくらい情報リテラシが低いので、どなたか替わりに分析してくださる方はいらっしゃらないでしょうか。
ファイルはskydriveにおいてあります。mdfファイルなので、SQL Server 2005でアタッチして利用してください。中身はテーブルが二つです。ユーザ情報のテーブルと、誰が誰をフォローしているかを示す情報を格納したテーブルがあります。こちらは、トップページに表示される、100アカウント分のfollowing情報しか含んでいません。

最後に、こばっとさんはIDが日本語なのですがこれって普通に可能なのでしょうか……。