ブログ「色々と考えてみる」の「文系のための「多次元データ解析」」を読み解く(1)

本当に参考にしているブログ「色々と考えてみる」の「文系のための「多次元データ解析」」。
本当に毎日通勤時に読んでは勉強させていただいています。

自分のメモも兼ねて、このブログの「文系的」読解方法と私のブログの目的である「ウェブディレクター」が活用していくためにどのように理解していったかをまとめてみようと思います。

序盤戦はなんとか通読して読み解けますが、後半から難しくなってきます。
それはきっと、本ブログにも記載されているように理解ができていないところで、復習をしないからw。

私は大学受験時に数学ができない、いわゆる「文系」でありましたが、無謀にも獣医学部を志望していたので、数学を独学で勉強していました。学校では文系コースを選んだもので相当苦労しました。
頼りになるのは参考書くらいなものだったので、数学系の参考書は相当読みました。
そこで気がついたのは、いわゆる「理系」の人が理解していて省いてしまうような数式をちゃんと書いてくれる参考書が少ないということ。理解できねーから参考書買っているのにこれではループ。このブログではきちんと繰り返し同じことを面倒だと思うようなことをあえて記述してくれています。
これで理解できなきゃ相当頭が悪いってことです。
ということで、このブログを頭に叩き込むべく復習していきます。(長っ)

文系のための「行列」(1)

慣れ親しんだエクセルとデータ構造を比較しながらデータ用語を解説してくれています。

◯エクセルの場合
 ブック > スプレッドシート > シート

[シートの構成要素]
 - セル(cell)
 - 値(Value)
 - 横方向に見た場合には「行(row)」
 - 縦方向に見た場合には「列(column)」

[データ構成]
 - 行と列によって表されたデータのことを「行列」データと呼ぶ。
 - 一行目に「ヘッダ(header)」と呼ばれる「項目名」があって、
 - 一列目には、「対象」の名前や識別子(ID)が入っている。
 - 二列目以降には、「項目名」に対応した「属性値(観測値)」が入っている。

文系のための「行列」(2)

引き続き用語解説。ここで出てくる用語は以後普通に出てくるので、暗記暗記。

◯スカラー(Scalar):普通の数字。
◯ベクトル(Vector):普通の数字が並んでいる状態。縦も横もない【ここ重要!】
◯行列(Matrix):普通の数字が並んでいる状態を積み重ねた状態。横方向に見た時は「行ベクトル」。縦方向で見た場合は「列ベクトル」。
◯次元(Dimension):事象の特徴を「空間」に写像するための「軸」のこと。私的解釈だと「対象物を説明するための要素数のこと」。より高次元なデータは、低次元なデータと比較して、ディテールを表現している。

高次元の事象を低次元に落とし込むことが、ある意味では、定量的な分析の課題

ふむふむ。

文系のための「行列」(3)

行列の種類とRの基本的な操作方法について。

◯正方行列・・・行数と列数が同じ行列のこと。n行 × p列の場合、n=pの状態のこと。
◯対称行列・・・「縦ベクトル」と「横ベクトル」が同じ行列のこと。
◯対角行列・・・対角成分以外が全て「0」であって、対角成分のみに値が入っている行列のこと。

# 三つのスカラー「5」と「8」と「3」から、
# 変数名を「x」とするベクトルを作る。
x <- c(5, 8, 3) # ベクトルx からMと名付けた行列を作る。 # rowは、行数を指定するパラメータ # ncolは、列数を指定するパラメータ M <- matrix(x, nrow=4, ncol=4)

# 行列M の行数を取り出す。
nrow(M)
# 行列M の列数を取り出す。
ncol(M)

> # 一つ目の「横ベクトル(一行目)」を抽出する
> M[1, ]

カンマの前で「行番号」を、後ろで「列番号」を指定できる。

> # 作ったベクトル「x」から、
> # 変数名を「M」とする「対角行列」を作る。
> (M <- diag(x))

diag()関数は、ベクトルから「対角行列」を作るための関数。

文系のための「行列」(4)

「変数」と「添字」についての解説。
変数:「軸」として布置されるある多次元の観測値のこと。属性値も対象値も変数。
添字:行列内における変数の場所を示す値。英語で「subscript」。

以後
「ブログ「色々と考えてみる」の文系のための「多次元データ解析」」を読み解く(2)」に続く。

Leave a Reply

%d人のブロガーが「いいね」をつけました。