主に、強化学習

情報系の大学2年生が確率に関連したことを多めに書いてるブログ

1.1.数学的準備@最適化数学 - 法線ベクトル

Commentary.

二変数関数f(x,y)及び連続微分可能な関数の場合の法線ベクトルについてです。

まず定理としては、


 曲線f(x,y) = 0 の点(x,y)における法線ベクトルは \nabla f = \left(
    \begin{array}{ccc}
     \frac{\partial f}{\partial x} \\ 
     \frac{\partial f}{\partial y} 
    \end{array} 
  \right) である。

ということなんですが、全然納得が出来てません。
途中の証明に



\Delta \overrightarrow{x}=    \left(
    \begin{array}{ccc}
    \Delta x \\ 
    \Delta y 
    \end{array} 
  \right) である。

とも書かれていて、


( \nabla f  ,\Delta \overrightarrow{x} ) + ... = 0\\

と書いてるし、マジで意味不明です…。

追記 - (1)

テイラー展開からどのように直交、法線ベクトルを求めたか、ぼんやりと理解できた気がする。

要は、テイラー展開によって

 

f(\bar{x},\bar{y}) = 0 \hspace{15pt} (1.3)\\
f( \bar{x} + \Delta{x} ,\bar{y} + \Delta{y} )  =  0   \hspace{15pt} (1.4)\\
f( \bar{x} + \Delta{x} ,  \bar{y} + \Delta{y} )  =   f(\bar{x},\bar{y}) + \frac{\partial f}{\partial x} \Delta{x} + \frac{\partial f}{\partial y} \Delta{y} + ...   \hspace{15pt} (1.5)

ということがわかり、(1.4)で 0となっているので、「もしベクトル形式だったら直交」であると言え、(1.5)のかたちで、(1.3)は消えるので、偏導関数の部分だけになり、それをベクトル形式に変換し、内積してる形にすることが出来る。それが \nabla{f}と\Delta \overrightarrow{x} であるということです。

あと、ちょっとキレそうなのが


( \nabla f  ,\Delta \overrightarrow{x} ) + ... = 0\hspace{15pt}...(1)\\

って先日書いたやつなんですけど、


( \nabla f  ,\Delta \overrightarrow{x} ) = 0\hspace{15pt}...(2)\\

って書いてくれてたらまだわかったかもしれない…、(2)より(1)のほうが正しい理由がわかんねぇ…。

+ ... 以降は、2次以上になっていってそれを小さくしていくとなくなるから。とのことかもです。

追記 Question

自分「だったらお前、授業中にやったらテイラー展開覚えてんの?」
僕「ゴメンナサイ」
自分「証明して」
僕「近似…あ、わからない…」

>明日追記します<

追記 from teacher


(\nabla f, \Delta \bf{x})=0
ではなく,本の
(\nabla f,
\Delta \bf{x})+\cdots=0
が正しいです.
というのは, f(x,y)をテーラー展開したとき, ブログの(1.5)において
「+\cdots」の部分があるわけで,その部分が
(\nabla f, \Delta \bf{x})+\cdots=0の\cdots の部分に効いてきていま
す. 今はテーラー展開したいので
\Delta ,\Delta yという量をもちだしているわけですが, これは最終的
に0にもっていくので,それに伴って
\cdotsの部分もゼロになり,よって最終的には(\nabla f,\Delta
\bf{x})=0になるわけです.

ブログ内の(1)と(2)で両方\nabla fが出てきていますが, その2つ
\nablaは意味が違います.

(1)の\nabla fは正確に書くと\nabla f (\bar{x}+\Delta
\bf{x},\bar{y}+\Delta \bf{y})であり,

(2)の\nabla fは正確に書くと\nabla f (\bf{x},\bf{y})です.

\Delta \bf{x},\Delta \bf{y}0に収束した結果\nabla f
(\bar{x}+\Delta \bf{x},\bar{y}+\Delta \bf{y})
\nabla f (\bf{x},\bf{y})に収束しています.

まとめると, (1)の(\nabla f, \Delta \bf{x})+\cdots=0は正確に書くと

$(\nabla f (\bar{x}+\Delta \bf{x},\bar{y}+\Delta \bf{y}, \Delta
\bf{x})+\cdots=0$・・・(1)'

であり, ここの\Delta \bf{x},\Delta \bf{y}を0に収束させる
\cdotsの部分は0に収束し,
\nabla f (\bar{x}+\Delta \bf{x},\bar{y}+\Delta \bf{y}\nabla f
(\bar{x},\bar{y})に収束するので
(1)'は晴れて

(\nabla f, \Delta \bf{x})=0

となるわけです.