hoge hoge - 線形最小2乗法(LeastSquareFit)

Mapleテキスト Index Search Changes Login

Mapleによる最小2乗法
最小2乗法の原理
$\chi^2$の極小値から(2変数の例)
正規方程式(Normal Equations)による解

Mapleによる具体例

特異値分解(Singular Value Decomposition)による解
2次元曲面へのフィット

Mapleによる具体例
正規方程式による解法

課題

Mapleによる最小2乗法

前章では，データに多項式を完全にフィットする補間についてみた．今回は，近似的にフィットする最小二乗法について詳しくみていく．図のようなデータに直線をフィットする場合を考えよう．

コマンドleastsquareによるfitting(2変数の例)

> restart: X:=[1,2,3,4]: Y:=[0,5,15,24]:
> with(plots):with(linalg):with(stats):
> l1:=pointplot(transpose([X,Y]),symbolsize=30):
> eq_fit:=fit[leastsquare[[x, y], y = a0+a1*x, {a0,a1}]]([X, Y]);

$$ eq\_fit\, := \,y=-\frac{19}{2}+{\frac {41}{5}}\,x $$

> f1:=unapply(rhs(eq_fit),x);

$$ f1\, := \,x\mapsto -\frac{19}{2}+{\frac {41}{5}}\,x $$

> p1:=plot(f1(x),x=0..4):
> display(p1,l1);

最小2乗法の原理

もっとも簡単な例で原理を解説する．近似関数として，

$$ F(x) = a_0+a_1\,x $$

という直線近似を考える．もっともらしい関数は$N$点の測定データとの差$d_i = F(x_i)-y_i$を最小にすればよさそうであるが，これはプラスマイナスですぐに消えて不定になる．そこで，

$$ \chi^{2}=\sum_i^N d_i^2=\sum_i^N\left(a_0+a_1\,x_i-y_i\right)^2 $$

という関数を考える．この$\chi^2$(カイ二乗)関数が，$a_0, a_1$をパラメータとして変えた時に最小となる$a_0, a_1$を求める．これは，それらの微分がそれぞれ0となる場合である．これは$\chi^2$の和$\sum$(sum)の中身を展開し，

$\chi^2=$

$a_0, a_1$でそれぞれ微分すれば

$ \frac{\partial}{\partial a_0} \chi^2 =$
$ \frac{\partial}{\partial a_1} \chi^2 =$

という$a_0, a_1$を未知変数とする2元の連立方程式が得られる．これは前に説明した通り逆行列で解くことができる．

$\chi^2$の極小値から(2変数の例)

> restart; X:=[1,2,3,4]: Y:=[0,5,15,24]: f1:=x->a0+a1*x:
  S:=0: 
  for i from 1 to 4 do 
    S:=S+(f1(X[i])-Y[i])^2; 
  end do:
> fS:=unapply(S,(a0,a1));

$$ {\it fS}\, := \,( {{\it a0},{\it a1}} )\mapsto \left( {\it a0}+{\it a1} \right) ^{2}+ \left( {\it a0}+2\,{\it a1}-5 \right) ^{2}+ \left( {\it a0}+3\,{\it a1}-15 \right) ^{2}+ \left( {\it a0}+4\,{\it a1}-24 \right) ^{2} $$

> expand(fS(a0,a1));

$$ 4\,{{\it a0}}^{2}+20\,{\it a0}\,{\it a1}+30\,{{\it a1}}^{2}-88\,{\it a0}-302\,{\it a1}+826 $$

> plot3d(fS(a0,a1),a0=-20..20,a1=0..20);

> eqs:={diff(expand(S),a0)=0, diff(expand(S),a1)=0};

$$ {\it eqs}\, := \, \left\{ 8\,{\it a0}+20\,{\it a1}-88=0,20\,{\it a0}+60\,{\it a1}-302=0 \right\} $$

> solve(eqs,{a0,a1});

$$ \left\{ {\it a0}=-\frac{19}{2},{\it a1}={\frac {41}{5}} \right\} $$

正規方程式(Normal Equations)による解

より一般的な場合の最小二乗法の解法を説明する．先程の例では1次の多項式を近似関数とした．これをより一般的な関数，例えば，$\sin, \cos, \tan, \exp, \sinh$などとする．これを線形につないだ関数を

$$ F \left(x \right)=a _{0}\sin \left(x \right)+a _{1}\cos \left(x \right)+a _{2}\exp \left(-x \right)+a _{3}\sinh \left(x \right)+\cdots ={\sum_{k=1}^{M}}a _{k }X _{k }\left(x \right) $$

ととる．実際には，$X_k(x)$はモデルや，多項式の高次項など論拠のある関数列をとる．これらを基底関数(base functions)と呼ぶ．ここで線形といっているのは，パラメータ$a_k$について線形という意味である．このような，より一般的な基底関数を使っても，$\chi^2$関数は

$$ {\chi}^{2}=\sum _{i=1}^{N} \left( F \left( x_{{i}} \right) -y_{{i}} \right) ^{2} =\sum _{i=1}^{N} \left( \sum _{k=1}^{M}a_{{k}}X_{{k}} \left( x_{{i}} \right) -y_{{i}} \right) ^{2} $$

と求めることができる．この関数を，$a_k$を変数とする関数とみなす．この関数が最小値を取るのは，$\chi^2$を$M$個の$a_k$で偏微分した式がすべて0となる場合である．これを実際に求めてみると，

$$ \sum _{i=1}^{N} \left( \sum _{j=1}^{M}a_{{j}}X_{{j}} \left( x_{{i}} \right) -y_{{i}} \right) X_{{k}} \left( x_{{i}} \right) =0 $$

となる．ここで，$k = 1..M$の$M$個の連立方程式である．この連立方程式を最小二乗法の正規方程式(normal equations)と呼ぶ．

上記の記法のままでは，ややこしいので，行列形式で書き直す．$N \times M$で，各要素を

$$ A_{ij} = X_j(x_i) $$

とする行列$A$を導入する．この行列は，

$$ A=\left[ \begin{array}{cccc} X_1(x_1) & X_2(x_1) & \cdots & X_M(x_1) \\ \vdots & \vdots & \cdots & \vdots \\ \vdots & \vdots & \cdots & \vdots \\ \vdots & \vdots & \cdots & \vdots \\ X_1(x_N) & X_2(x_N) & \cdots & X_M(x_N) \end{array} \right] $$

となる．これをデザイン行列と呼ぶ．すると先程の正規方程式は，

$$ A^t . A . a = A^t . y $$

で与えられる．$A^t$は行列$A$の転置(transpose)

$$ A^t = A_{ij}^t = A_{ji} $$

を意味し，得られた行列は，$M \times N$である．$a, y$はそれぞれ，

$$ a=\left[ \begin{array}{c} a_1\\a_2\\\vdots\\a_M \end{array} \right],\, y=\left[ \begin{array}{c} y_1\\y_2\\\vdots\\y_N \end{array} \right] $$

である．

$M = 3, N = 25$として行列の次元だけで表現すると，

$$ \left[ \begin{array}{ccccc} & & \cdots & &\\ \cdots & \cdots & \cdots & \cdots & \cdots \\ & & \cdots & &\\ \end{array} \right] \left[ \begin{array}{ccc} & \vdots &\\ & \vdots &\\ \cdots & \cdots & \cdots\\ & \vdots &\\ & \vdots &\\ \end{array} \right] \left[ \begin{array}{c} \vdots\\ \vdots\\ \vdots \end{array} \right] = \left[ \begin{array}{ccccc} & & \cdots & &\\ \cdots & \cdots & \cdots & \cdots & \cdots \\ & & \cdots & &\\ \end{array} \right] \left[ \begin{array}{c} \vdots\\ \vdots\\ \vdots\\ \vdots\\ \vdots \end{array} \right] $$

となる．これは少しの計算で$3 \times 3$の逆行列を解く問題に変形できる．

Mapleによる具体例

> restart; X:=[1,2,3,4]: Y:=[0,5,15,24]: 
  f1:=x->a[1]+a[2]*x+a[3]*x^2:
  with(LinearAlgebra): Av:=Matrix(1..4,1..3):
  ff:=(x,i)->x^(i-1):
  for i from 1 to 3 do 
    for j from 1 to 4 do
      Av[j,i]:=ff(X[j],i); 
    end do; 
  end do;
  Av;

$$ \left[ \begin{array}{ccc} 1&1&1\\1&2&4\\1&3&9\\1&4&16\end {array} \right] $$

> Ai:=MatrixInverse(Transpose(Av).Av);

$$ {\it Ai}\, := \, \left[ \begin {array}{ccc} { \frac {31}{4}}&-{ \frac {27}{4}}& \frac{5}{4}\\ -{ \frac {27}{4}}&{ \frac {129}{20}}& -\frac{5}{4}\\ \frac{5}{4}& -\frac{5}{4}& \frac{1}{4} \end {array} \right] $$

> b:=Transpose(Av).Vector(Y);

$$ b\, := \, \left[ \begin {array}{c} 44\\151\\539\end {array} \right] $$

> Ai.b;

$$ \left[ \begin {array}{c} -\frac{9}{2}\\ {\frac {16}{5}}\\ 1\end {array} \right] $$

特異値分解(Singular Value Decomposition)による解

正規方程式を解くときには，少し注意が必要である．正規方程式での共分散行列,特異値分解の導出や標準偏差との関係はNumRecipeを参照せよ．

> restart; X:=[1,2,3,4]: Y:=[0,5,15,24]: f1:=x->a[1]+a[2]*x+a[3]*x^2:
> with(LinearAlgebra): Av:=Matrix(1..4,1..3):
> ff:=(x,i)->x^(i-1): 
  for i from 1 to 3 do 
    for j from 1 to 4 do
      Av[j,i]:=ff(X[j],i); 
    end do; 
  end do; 
  Av;

$$ \left[ \begin {array}{ccc} 1&1&1\\1&2&4\\1&3&9\\1&4&16\end {array} \right] $$

> U,S,Vt:=evalf(SingularValues(Av,output=['U','S','Vt'])):
> DiagonalMatrix(S[1..3],4,3); U.DiagonalMatrix(S[1..3],4,3).Vt:

$$ \left[ \begin {array}{ccc} 19.6213640200000015&0&0\\0& 1.71206987399999999&0\\0&0& 0.266252879300000022\\0&0&0\end {array} \right] $$

> iS:=Vector(3): 
  for i from 1 to 3 do 
    iS[i]:=1/S[i]; 
  end do:
> DiS:=DiagonalMatrix(iS[1..3],3,4);

$$ {\it DiS}\, := \, \left[ \begin {array}{cccc} 0.05096485642&0&0&0\\0& 0.5840883104&0&0\\0&0& 3.755827928&0\end {array} \right] $$

> Transpose(Vt).DiS.(Transpose(U).Vector(Y));

$$ \left[ \begin {array}{c} - 4.50000000198176498\\ 3.20000000035008324\\ 1.00000000040565196\end {array} \right] $$

2次元曲面へのフィット

先程の一般化をより発展させると，3次元$(x_i, y_i, z_i)$で提供されるデータへの，2次元平面でのフィットも可能となる．2次元の単純な曲面は，方程式を使って，

$$ F(x, y) = a_1+a_2\,x+a_3\,y+a_4\,xy+a_5\,x^2+a_6\,y^2 $$

となる．デザイン行列の$i$行目の要素は，

$$ [1, x_i, y_i, x_i\,y_i, x_i^2, y_i^2] $$

として，それぞれ求める．このデータの変換の様子をMapleスクリプトで詳しく示した．後は，通常の正規方程式を解くようにすれば，このデータを近似する曲面を定めるパラメータ$a_1, a_2, \cdots,a_6$が求まる．最小二乗法はパラメータ$a_k$について線形であればよい．

Mapleによる具体例

実際のデータ解析での例．データの座標をx,y,zで用意して，Mapleの埋め込み関数のleastsquareでfitしている．

> with(plots):with(plottools): 
  z:=[0.000046079702088, 0.000029479057275,
  0.000025769637830, 0.000034951410953, 0.000057024385455, 0.000029485453808,
  0.000011519913869, 0.000006442404299, 0.000014252898382, 0.000034951410953,
  0.000025769637773, 0.000006442404242, 0.000000000000057, 0.000006442404242,
  0.000025769637773, 0.000034932221524, 0.000014246501905, 0.000006442404299,
  0.000011519913926, 0.000029479057332, 0.000056973214100, 0.000034932221467,
  0.000025769637773, 0.000029485453808, 0.000046079702031]:
>  x:=[]:
  y:=[]:
  p1:=2:
  for i from -p1 to p1 do
    for j from -p1 to p1 do
      x:=[op(x),i*0.0005];
      y:=[op(y),j*0.0005];
    end do;
  end do;
> with(LinearAlgebra): p2:=convert(Transpose(Matrix([x,y,z])),listlist):
  pp2:=pointplot3d(p2,symbol=circle,symbolsize=30,color=black):
  with(stats): data:=[x,y,z]: 
  fit1:=fit[leastsquare[[t,s,u], 
    u=a1+a2*t+a3*s+a4*t*s+a5*t^2+a6*s^2, 
    {a1,a2,a3,a4,a5,a6}]](data);

$$ {\it fit1}\, := \,u=-{ 8.657142857\times 10^{-13}}- 0.000006396456800\,t+ 0.000006396438400\,s\notag \\ - 5.459553587\,ts+ 25.76962838\,{t}^{2}+ 25.76962835\,{s}^{2} \notag $$

> f1:=unapply(rhs(fit1),(s,t)):
> pf1:=plot3d(f1(ss,uu),ss=-0.001..0.001,uu=-0.001..0.001,color=gray):
> display(pf1,pp2,axes=boxed);

正規方程式による解法

デザイン行列へのデータ変換

> bb:=Vector(25): A:=Matrix(25,6): 
  p1:=2: 
  for i from 1 to 25 do 
    A[i,1]:=1;
    A[i,2]:=x_i; 
    A[i,3]:=y_i; 
    A[i,4]:=x_i*y_i; 
    A[i,5]:=x_i^2; 
    A[i,6]:=y_i^2;
    bb_i:=z_i; 
  end do:

正規方程式の解

> MatrixInverse(Transpose(A).A).(Transpose(A).bb);

$$ \left[ \begin {array}{c} -{ 9.185257196\times 10^{-13}}\\ - 0.00000639644675999994798\\ 0.00000639644220000032532\\ - 5.45955358336000173\\ 25.7696284050857187\\ 25.7696284050857543\end {array} \right] $$

課題

1次元の線形最小二乗法

次の4点のデータを$y = a_1+a_2 x+a_3 x^2$で近似せよ(2006年度期末試験)．

X:=[0,1,2,3];
Y:=[1,3,4,10];

2次元の最小二乗フィット

以下のデータを

$$ f(x, y) = a_1+a_2 x+a_3 y+a_4 xy $$

で近似せよ

 x,  y,  z
-1, -1,  2.00000
-1,  0,  0.50000
-1,  1, -1.00000
 0, -1,  0.50000
 0,  0,  1.00000
 0,  1,  1.50000
 1, -1, -1.00000
 1,  0,  1.50000
 1,  1,  4.00000

Last modified:2016/08/01 16:46:15
Keyword(s):
References:[NumMaple] [NumMapleTOC] [SideMenu]

基礎	FirstLeaf基本操作
	初等関数とそのほかの関数(Functions)
	Equals
応用	LA(線形代数)
	Differential(微分)
	積分(int)
発展	EqManip(式変形)
	CG(描画)
	その他

単元	日程
代数方程式(fsolve)	10/6
誤差(Error)	10/13
線形代数--写像(LAFundamentals)	10/20
線形代数--逆行列(LAMatrixInverse)	10/27
線形代数--固有値(LAEigen)	10/27
補間(interpolation)と数値積分(Integral)	11/10
線形最小2乗法(LeastSquareFit)	11/17
非線形最小2乗法(NonLinearFit)	11/24
FFT(Fast Fourier Transformation)	12/1
ODE	12/8
maple_ODEテキスト	12/8

線形最小2乗法(LeastSquareFit)

Mapleによる最小2乗法

最小2乗法の原理

$\chi^2$の極小値から(2変数の例)

正規方程式(Normal Equations)による解

Mapleによる具体例

特異値分解(Singular Value Decomposition)による解

2次元曲面へのフィット

Mapleによる具体例

正規方程式による解法

課題

Mapleテキスト

Mapleでプログラミング

Mapleで数値計算

最新の100件

2017-12-07

2017-10-26

2017-10-20

2016-11-14

2016-10-28

2016-10-21

2016-09-06

2016-08-20

2016-08-19

2016-08-16

2016-08-02

2016-08-01

2016-07-29

2016-07-18

2016-07-15

2016-07-14