数字の分類: Wolfram言語 11の新機能

数字の分類

手書き数字のMNISTデータベースを使って，画像で与えられた数字を予測するたたみ込みネットワークを訓練する．

訓練データと検証データを取得する．

In[1]:=

resource = ResourceObject["MNIST"];
trainingData = ResourceData[resource, "TrainingData"];
testData = ResourceData[resource, "TestData"];

In[2]:=

RandomSample[trainingData, 5]

Out[2]=

入力として28×28のグレースケール画像を取るたたみ込みニューラルネットワークを定義する．

In[3]:=

lenet = NetChain[
  {ConvolutionLayer[20, 5], Ramp, PoolingLayer[2, 2], 
   ConvolutionLayer[50, 5], Ramp, PoolingLayer[2, 2], FlattenLayer[], 
   500, Ramp, 10, SoftmaxLayer[]},
  "Output" -> NetDecoder[{"Class", Range[0, 9]}],
  "Input" -> NetEncoder[{"Image", {28, 28}, "Grayscale"}]
  ]

Out[3]=

3回の訓練ラウンドでネットワークを訓練する．

In[4]:=

lenet = NetTrain[lenet, trainingData, ValidationSet -> testData, 
   MaxTrainingRounds -> 3];

Out[5]=

検証集合からランダムに抽出された画像で，訓練されたネットワークを直接評価する．

In[6]:=

imgs = Keys @ RandomSample[testData, 5];
Thread[imgs -> lenet[imgs]]

Out[6]=

Wolfram言語™

数字の分類

関連する例