仕事のことはそもそもめったにここに書いていないが,それでもときどきコンピュータ・ネットワークについて書いてきた. 16 年くらいもそれを仕事にしてきたが,ついにべつの世界に足をいれることになった. 自動車の監視カメラの画像認識 (コンピュータ・ビジョンもしくは画像センシング) なのだが,それを深層学習 (deep learning) をつかってやるのだ. 深層学習は 2012 年以来注目をあつめていて,最近ではマスコミもいつ人工知能が人間をこえるかというような話題をとりあげている. しかし,実際にふみこんでみると,10 数年前とそれほどおおきくかわったようにはみえない. 人間をこえるなどということはありえないことだ.
このブログで深層学習について最初に書いたのは 「第 3 の AI ブームの熱気とわかりやすい技術解説 ― 松尾 豊 著,「人工知能は人間を超えるか ― ディープラーニングの先にあるもの」」 という本の書評だ. しかし,これを書いたときにはまだ自分がそこにかかわることになろうとは,まったくかんがえていなかった. 4 月から仕事がかわって,そこで話をきいてはじめてわかった.
深層学習でできるようになったことは,画像認識のようにもともとコンピュータが比較的得意だったことだ. 人間の言語のような複雑なものは,いまでもうまくあつかえない. 20 年前,40 年前と,その点ではすこしもかわっていない. 人工知能としてはボード・ゲームのプログラムもあって,チェスにつづいて将棋も人間をこえようとしているが,これは深層学習とはべつものだ. こちらも徐々にすすんでいるだけで,革命がおこっているわけではない.
以前はうまくあつかえなかったのがあつかえるように (学習させられるように) なったのは,多層 (深層) のニューラルネットだ. とくに,画像認識でつかうのは「たたみこみニューラルネット (convolutional neural network, CNN)」というタイプだ. CNN が議論されるようになったのは 1990 年代だが,そのもとになっているのは福島による Neocognitron であり,1970 年代末に登場している. 学習につかうのは基本的には backpropagation (誤差逆伝播法) であり,これは 1980 年代にニューラルネットに適用されたが,もっとふるくからある技術だという.
ニューラルネットを使用しない画像認識の技術のほうが私にとっては新奇だが,それについてはまたべつに書くことにしよう.