Распознавание изображений методом глубокого изучения
Глубокое изучение может использоваться с большим успехом для решения многих проблем обработки изображений и компьютерного зрения. С помощью функций NetChain и NetTrain, вы можете задать и обучить нейронную сеть, которая классифицирует рукописные цифры на основе заданного изображения.
Получим данные для обучения из базы данных MNIST, содержащей рукописные цифры.
In[1]:=
resource = ResourceObject["MNIST"];
trainingData = ResourceData[resource, "TrainingData"];
testData = ResourceData[resource, "TestData"];
In[2]:=
RandomSample[trainingData, 5]
Out[2]=
Разработаем сверточную нейронной сеть, спроектированную для распознавания черно-белых изображений с параметрами 28х28.
In[3]:=
lenet = NetChain[
{ConvolutionLayer[20, 5], Ramp, PoolingLayer[2, 2],
ConvolutionLayer[50, 5], Ramp, PoolingLayer[2, 2], FlattenLayer[],
500, Ramp, 10, SoftmaxLayer[]},
"Output" -> NetDecoder[{"Class", Range[0, 9]}],
"Input" -> NetEncoder[{"Image", {28, 28}, "Grayscale"}]
]
Out[3]=
Обучим сеть распознавать рукописные цифры в течение трех тренировочных раундов.
In[4]:=
lenet = NetTrain[lenet, trainingData, ValidationSet -> testData,
MaxTrainingRounds -> 3];
Out[4]=
Оценим работу обученной сети на случайно выбранных изображениях.
In[5]:=
imgs = Keys @ RandomSample[testData, 5];
Thread[imgs -> lenet[imgs]]
Out[5]=