Learning Deep Learning: Nieuwsgierig naar de foutjes

zondag 31 mei 2015

Nieuwsgierig naar de foutjes

Door de parameters aan te passen in de SVM.SVC (Support Vector Machines / Support Vector Classification) functie namenlijk gamma en C (gamma = Kernel coefficient for ‘rbf’, ‘poly’ and ‘sigmoid’. en C = Penalty parameter C of the error term - even doen alsof ik het begrijp :-) kan de gevoeligheid worden afgestemd op de betreffende invoer.

In eerste instantie maar eens alleen met de gamma spelen. Rond de 0.025 en 0.03 lijkt een betrouwbaarheid piek te zitten (97.02% bij 10.000 oefencijfers). Waarom is er geen DL-algoritme om dat optimum te bepalen? :-) Ik neem aan dat dat ook wel ergens zal zijn bedacht.

Ook is het interessant welke cijfers nou fout worden ingeschat. Na wat experimenteren met de code lukt het mij om ook daar voorbeelden van te tonen. De fouten lijken aannemelijk. Het zijn de complexere afbeeldingen. Vooral de laatste 2 rechtsonder zijn wel verrassend. Het lijkt zo beschouwd een wonder dat het convolutional netwerk uit oefening 5 in de buurt van de 99.5% komt:

('Prediction:', array([2]), 3)

('Prediction:', array([6]), 1)

('Prediction:', array([8]), 1

('Prediction:', array([5]), 1)

('Prediction:', array([6]), 5)

('Prediction:', array([4]), 7)

('Prediction:', array([9]), 2) ??

('Prediction:', array([8]), 9)

('Prediction:', array([4]), 9) ??

De gebruikte programmacode:

import matplotlib.pyplot as plt

import numpy as np

import time

from sklearn import svm

from load import mnist

trX, teX, trY, teY = mnist(onehot=True)

t0 = time.time()

ga = 0.027

size = 10000

clf = svm.SVC(gamma=ga, C=100)

clf.fit(trX[:size],np.argmax(trY[:size], axis=1))

print "reliability: ", np.mean(np.argmax(teY,axis=1) == clf.predict(teX)), time.time() - t0, "seconds, gamma: ", ga, " size :", size

t = 0

i = 0

while (t < 5 and i < 10000):

if (np.argmax(teY[i],axis=0) != clf.predict(teX[i])):

t += 1

print ('Prediction:', clf.predict(teX[i]), np.argmax(teY[i],axis=0), "i - " , i)

im=teX[i]

im.shape=28,28

plt.imshow(im, cmap=plt.cm.gray_r, interpolation="nearest")

plt.show()

i += 1

Geen opmerkingen:

Een reactie posten

Code hulp

Numpy vstack

-----------------

ys = np.array([])

ys = np.vstack([ys, xs]) if ys.size else xs

Numpy unique (set in numpy)

-----------------

h = np.unique(x)

----

opencv : coordinaten: (hoogte, breedte)

Numpy: coordinaten: (row, column)

---

Numpy delete 'bad' rows

-----------------------------

x = x[numpy.in1d(x[:,0], bad, invert=True)]

Python sorting

-----------------

SlicLoc = sorted(SlicLoc, key = lambda x: (x[0],float(x[3])))

Pandas

----------

import pandas as pd

Td = pd.DataFrame(Tdist)

print(Td.describe())

Pickle

--------

import cPickle as pickle

with open('/Users/DWW/Documents/net1.pickle', 'wb') as f:

pickle.dump(net1, f, -1)

-------

Center of image

from scipy import ndimage

x,y = ndimage.measurements.center_of_mass(combi)

-------

reset CPU:

export LD_LIBRARY_PATH="/usr/local/cuda/lib"

export PATH=/usr/local/cuda/bin:$PATH

export DYLD_LIBRARY_PATH=/usr/local/cuda/lib:$DYLD_LIBRARY_PATH