ディープラーニングを使った画像認識: Wolfram言語 11の新機能

ディープラーニングを使った画像認識

ディープラーニングは，数多くの画像処理およびコンピュータビジョンの問題に非常にうまく適用することができる．NetChainとNetTrainを使って，画像で与えられた手書きの数字を分類するニューラルネットワークを定義，訓練することができる．

手書きの数字についてのMNISTデータセットから，訓練データと検証データを得る．

In[1]:=

resource = ResourceObject["MNIST"];
trainingData = ResourceData[resource, "TrainingData"];
testData = ResourceData[resource, "TestData"];

In[2]:=

RandomSample[trainingData, 5]

Out[2]=

28×28のグレースケール画像を認識するように構築された，たたみ込みニューラルネットワークを設計する．

In[3]:=

lenet = NetChain[
  {ConvolutionLayer[20, 5], Ramp, PoolingLayer[2, 2], 
   ConvolutionLayer[50, 5], Ramp, PoolingLayer[2, 2], FlattenLayer[], 
   500, Ramp, 10, SoftmaxLayer[]},
  "Output" -> NetDecoder[{"Class", Range[0, 9]}],
  "Input" -> NetEncoder[{"Image", {28, 28}, "Grayscale"}]
  ]

Out[3]=

3度の訓練でネットワークを訓練する．

In[4]:=

lenet = NetTrain[lenet, trainingData, ValidationSet -> testData, 
   MaxTrainingRounds -> 3];

Out[4]=

訓練されたネットワークを，検証集合からランダムにサンプリングされた画像に直接使って評価する．

In[5]:=

imgs = Keys @ RandomSample[testData, 5];
Thread[imgs -> lenet[imgs]]

Out[5]=

関連する例

動的時間伸縮法を使って2つの心電図信号を比べる

動的時間伸縮法を使って株価を比べる

シカゴとヨーロッパ諸国の首都の天候を比べる

国の形を比べる

有糸分裂の力学

オプティカルフローを使ったスローモーション

回転するオブジェクトを検知する

回転するオブジェクトの拡張現実

顕著な画像領域を探して抽出する

顕微鏡画像の被写界深度の解像度を向上させる

成分解析のために更新された選択とフォーマット

速度の向上