GDPを知る①

久しぶりのRで戸惑う。
いきなりのCSVファイル読み込みエラーで1時間くらい経過。
結果、エクセルでのデータ処理でセルの書式設定で値が「通貨」になっていることを思い出す。
「標準」にしてCSV書き出ししないと正しくデータを取ってくれないばかりか、あらゆる関数でエラーが出ます。

気を取り直してGDPを調査。
内閣府のHPの統計一覧(http://www.esri.cao.go.jp/jp/sna/data/data_list/sokuhou/files/2014/qe142_2/gdemenuja.html)よりCSVデータを拝借。右クリックで対象ファイルを保存してもOKですが、ブラウザでコピーしてエクセルにペーストしてもOKです。

いつものように、Rコマンダーでインポートしていきます。

> library(Rcmdr)

先ほど作ったCSVは「data」というデータ名で保存しておきます。

インポートが完了したら、head()関数で中身をチェックします。

> head(data2)
Year.Q GDP.Expenditure.Approach.
1 1994/1Q 119879.2
2 1994/2Q 120882.8
3 1994/3Q 122430.1
4 1994/4Q 132551.4
5 1995/1Q 119748.0
6 1995/2Q 123289.2

内閣府のデータでは、民間最終消費支出やら家計最終消費支出やらが入っていますが、2列目にある「国内総生産(支出側)」列のみを使用します。
また、時系列も第一四半期が「4-6.」のように表記されているので、上記のように「◯◯◯◯/◯Q」のように見た目をシンプルに加工しておきます。

早速plot()関数で出力してみます。

スクリーンショット 2014-10-07 1.19.16

なんということでしょう。
正直なんだかよくわからないグラフになります。
これは1年周期で1Qごとのプロットが細かいためきれいな折れ線が描けないためです。

そこで、dataを加工して以下のようにします。

> head(data)
Year.Q GDP.1Q GDP.2Q GDP.3Q GDP.4Q
1 1994 119879.2 120882.8 122430.1 132551.4
2 1995 119748.0 123289.2 123408.0 135261.7
3 1996 122635.4 125717.4 125189.7 138392.3
4 1997 126644.5 128760.9 128227.8 139565.1
5 1998 124741.6 126065.5 124762.9 136868.6
6 1999 123222.2 124950.1 122883.2 133847.6

列を四半期ごとに切り分け、表示するデータを四半期別にします。
このようにして再度、plot()していきます。今回は第四四半期を使用します。

スクリーンショット 2014-10-07 1.23.47

なかなか渋いグラフになりました。
年度が気持ち悪いのでplot()関数の引数xaxpを使用してX軸の範囲を指定して描画します。

スクリーンショット 2014-10-07 1.25.50

大分まともになりました。
2009年に大幅に減少して2014年にかなり回復してきているものの2007年の水準には戻っていないことがわかります。2010年に軌跡の大逆転のチャンスがあったものの2011年の震災によって再び2012年には下降していることがわかります。

と、ここまでは誰でも知っている常識ですが、次回以降はもう少し掘り下げて見てみることにしていきます。

Leave a Reply

%d人のブロガーが「いいね」をつけました。