変量の変換①(平均・分散・標準偏差)

 

→高校数学TOP

 

もとのデータの変量\(x\)に対して、\(y=ax+b\) (\(a,b\)は定数)と新たな変量\(y\)を定義したとき、\(y\)の平均値や分散は\(x\)の平均値と分散とどのような関係があるのでしょうか。

 

 

・変量の変換(平均値)
もとの変量\(x\)のデータ(個数\(n\))の値を、\(x_1,x_2,・・・x_{n}\)として、あらたな変量\(y\)を \(y=ax+b\) と定義し、\(y_{i}=ax_{i}+b\) (\(i=1,2,・・・n)\)とします。\(x\)の平均値を\(\bar{x}\)、\(y\)の平均値を\(\bar{y}\)とすると、

\(\bar{y}=\displaystyle\frac{1}{n}(y_1+y_2+・・・+y_{n})\)
\(=\displaystyle\frac{1}{n}\{(ax_1+b)+(ax_2+b)+・・・+(ax_{n}+b)\}\)
\(=a・\displaystyle\frac{1}{n}(x_1+x_2+・・・+x_{n})+\displaystyle\frac{1}{n}・(nb)\)
\(=a\bar{x}+b\)

 

\(y=ax+b\) と変量変換したとき
\(\bar{y}=a\bar{x}+b\)
単純に変量の部分にバーをつけるだけです。

 

 

・変量の変換(分散・標準偏差)
さきほどと同様に\(y\)を定義します。\(x\)の分散を\(s_{x}^2\)、\(y\)の分散を\(s_{y}^2\)とすると、\(\bar{y}=a\bar{x}+b\)より

 

\(s_{y}^2=\displaystyle\frac{1}{n}\{(y_1-\bar{y})^2+(y_2-\bar{y})^2+・・・+(y_{n}-\bar{y})^2\}\) (分散の定義)

\(=\displaystyle\frac{1}{n}[\{(ax_1+b)-(a\bar{x}+b)\}^2+\)
\(\{(ax_2+b)-(a\bar{x}+b)\}^2+・・・\)
\(+\{(ax_{n}+b)-(a\bar{x}+b)\}^2]\)

\(=\displaystyle\frac{1}{n}\{a^2(x_1-\bar{x})^2+a^2(x_2-\bar{x})^2+・・・\)
\(+a^2(x_{n}-\bar{x})^2\}\)

\(=a^2\displaystyle\frac{1}{n}\{(x_1-\bar{x})^2+(x_2-\bar{x})^2+・・・+(x_{n}-\bar{x})^2\}\)

\(=a^2s_{x}^2\)

 

\(y=ax+b\) と変量変換したとき
\(s_{y}^2=a^2s_{x}^2\)
分散については定数\(b\)は変換に関係しません。\(+b\)というのはヒストグラムでいうとグラフがそのまま横方向に移動することなので散らばりを表す分散は変化しないからです。\(a\)に関しては2乗することを忘れずに。

 

標準偏差は分散の正の平方根なので,\(x\)の標準偏差を\(s_{x}\)、\(y\)の標準偏差を\(s_{y}\)とすると
\(s_{y}=\sqrt{a^2s_{x}^2}=|a|s_{x}\)

 

\(y=ax+b\) と変量変換したとき
\(s_{y}=|a|s_{x}\)

 

 

 

例題を見てみて少し慣れましょう。

 

(例題1)
変量\(x\)のデータの平均値を\(\bar{x}=\displaystyle\frac{37}{10}\)、分散を\(s_{x}^2=\displaystyle\frac{201}{100}\) とする。

(1)\(y=10(x-3)\)と定義された変量\(y\)の平均値と分散と標準偏差を求めよ。
(2)\(x\)の標準偏差を\(s_x\)とするとき、\(z=\displaystyle\frac{x-\bar{x}}{s_x}\)で定義された変量\(z\)の平均値と分散を求めよ。

 

(解答)
(1)求める平均値、分散、標準偏差を\(\bar{y},s_{y}^2,s_{y}\)とすると

\(y=10x-30\)だから

\(\bar{y}=10\bar{x}-30=10・\displaystyle\frac{37}{10}-30=\)\(7\)

\(s_{y}^2=10^2s_{x}^2=100・\displaystyle\frac{201}{100}=\)\(201\)

\(s_{y}=|10|s_{x}=10・\sqrt{\displaystyle\frac{201}{100}}=\)\(\sqrt{201}\)

 

(2)

\(\bar{x}\)と\(s_x\)は定数であることに注意してください。

求める平均値、分散を\(\bar{z},s_{z}^2\)とすると

\(\bar{z}=\displaystyle\frac{\bar{x}-\bar{x}}{s_x}=\)\(0\)

\(s_{z}^2=\displaystyle\frac{1}{s_x^2}s_x^2=\)\(1\)

 

(2)のように、もとの変量について平均値を引いて標準偏差で割るという変換をすると、新たな変量の平均値と分散はそれぞれ、0,1になります。(もとの変量の平均値、分散の値によらない) これを標準化といいます。

 

 

(例題2)
次の変量\(x\)のデータについて以下の問いに答えよ。
\(40,40,50,55,60,65,75,75,80,85\)

 

(1)\(y=x-60\)とおいて、変量\(y\)の平均値\(\bar{y}\)を計算して、\(x\)の平均値\(\bar{x}\)を求めよ。
(2)\(u=\displaystyle\frac{x-60}{5}\)とおいて、変量\(u\)の標準偏差\(s_{u}\)を計算して、\(x\)の標準偏差\(s_{x}\)を求めよ。

 

 

(解答)
(1)\(x\)と\(y\)の値を表にすると次の通り。
変量変換 例題(1)
よって\(\bar{y}=\displaystyle\frac{1}{10}・25=2.5\)
\(\bar{y}=\bar{x}-60\)だから、
\(\bar{x}=\bar{y}+60=2.5+60=\)\(62.5\)

 

変換により引いた数60は仮平均とよばれます。仮平均を利用することで計算が楽になる場合があるので利用されます。一般的には、n個のデータからおおよその平均\(x_0\)(仮平均)を見積もって、\(y=x-x_0\)と変換します。
\(\bar{x}=x_0+\bar{y}\)
\(=x_0+\displaystyle\frac{1}{n}\{(x_1-x_0)+(x_2-x_0)+・・・(x_{n}-x_0)\}\)
となるので、見積もった平均にずれの平均値を足してやることで真の平均値を求めることができます。

 

(2)
\(u\)の標準偏差を求める為に分散を計算します。
\(s_{u}^2=\bar{u^2}-(\bar{u})^2\) なので、\(u\)と\(u^2\)の平均値を計算します。
\(x,u,u^2\)をまとめると次の表のとおり。
変量変換 例題(2)
\(u\)の平均を\(\bar{u}\)とすると
\(\bar{u}=\displaystyle\frac{5}{10}\)
\(u^2\)の平均を\(\bar{u}^2\)とすると
\(\bar{u}^2=\displaystyle\frac{97}{10}\)

 

したがって、\(u\)の分散\(s_{u}^2\)は
\(s_{u}^2=\bar{u^2}-(\bar{u})^2=\displaystyle\frac{97}{10}-(\displaystyle\frac{5}{10})^2=\displaystyle\frac{945}{100}\)であり
\(s_{u}=\sqrt{\displaystyle\frac{945}{100}}=\displaystyle\frac{3\sqrt{105}}{10}\)

 

\(u=\displaystyle\frac{x-60}{5}\) より \(x=5u+60\)だから
\(s_{x}=|5|s_{u}=5・\displaystyle\frac{3\sqrt{105}}{10}=\)\(\displaystyle\frac{3\sqrt{105}}{2}\)

 

 

 

 

 

以上になります。お疲れさまでした。
ここまで見て頂きありがとうございました。

→高校数学TOP next→散布図と相関 back→2つのデータ合計の分析

タイトルとURLをコピーしました