woensdag 21 december 2016

05 Fish - En nu een submission maken.

Ik heb mij nog niet zo bezig gehouden met het voorbereiden van de werkelijke submission. Zelfs de testdata bleek ik nog niet op mijn pc te hebben geladen. Snel een download en een programma om de data in he juiste formaat om te zetten. Tevens 'sorteer' ik ook deze afbeeldingen op 'overeenkomstigheid' omdat ik vermoed dat er regelmatig, kort op elkaar volgende afbeeldingen zijn gebruikt waar dus dezelfde soort vis op te zien moet zijn. Bij twijfel kan dat dus een doorslag geven.



De gewenste output ziet er zo uit: (meegeleverd voorbeeld)

image,ALB,BET,DOL,LAG,NoF,OTHER,SHARK,YFT
img_00005.jpg,0.45500264690312336,0.05293806246691371,0.03096876654314452,0.017734250926416093,0.12308099523557438,0.07914240338803599,0.046585494970884066,0.1942826892535733
img_00007.jpg,0.45500264690312336,0.05293806246691371,0.03096876654314452,0.017734250926416093,0.12308099523557438,0.07914240338803599,0.046585494970884066,0.1942826892535733
img_00009.jpg,0.45500264690312336,0.05293806246691371,0.03096876654314452,0.017734250926416093,0.12308099523557438,0.07914240338803599,0.046585494970884066,0.1942826892535733
img_00018.jpg,0.45500264690312336,0.05293806246691371,0.03096876654314452,0.017734250926416093,0.12308099523557438,0.07914240338803599,0.046585494970884066,0.1942826892535733
img_00027.jpg,0.45500264690312336,0.05293806246691371,0.03096876654314452,0.017734250926416093,0.12308099523557438,0.07914240338803599,0.046585494970884066,0.1942826892535733

Een waarschijnlijkheid dus per vissoort. Mooi dat regelt mijn gebruikte model ook als output alleen besef ik mij nu dat ik de 'vis volgorde' heb aangepast:


fishtypes = ['BET','DOL','LAG','NoF','OTHER','SHARK','YFT','ALB']

Hierdoor kwam de grootste groep aan het einde. Ik geloof dat dit vooral was om snel te kunnen testen.

Mijn tussenuitkomsten zien er zo uit:


[  5.55696040e-02   3.63390967e-02   3.35246362e-02   2.71632709e-02
   1.92823112e-01   1.01814854e-04   5.17386533e-02   6.02739811e-01]
[ 0.07084329  0.01330838  0.01655073  0.02492231  0.05961363  0.00400923
  0.10697447  0.70377797]
[  3.16158533e-02   5.14484383e-02   8.70272238e-03   1.64415389e-02
   3.37270200e-01   9.72153975e-06   2.47996226e-02   5.29711902e-01]
[ 0.09419882  0.01306145  0.04260941  0.01321667  0.08773319  0.00299926
  0.10487828  0.64130288]
[ 0.02304434  0.00076831  0.00147995  0.00258547  0.18335994  0.06462369

  0.31772998  0.40640843]

Opvallend is dat meestal de laatste groep de hoogste kans heeft. Gelukkig zijn er wat uitzonderingen : (Aantal hoogste kans per vissoort)


0 0
1 0
2 0
3 21
4 2
5 3
6 47

7 927

Ligt een beetje in lijn met het aantal vissen per vissoort in de traindataset:


0 200
1 117
2 67
3 465
4 299
5 176
6 734
7 1719

Maar ja, gevoelsmatig valt het nog een beetje tegen. Was leuk geweest als die van alle types wat meer had herkent. Maar goed, we zullen eens kijken wat dit oplevert.






Geen opmerkingen:

Een reactie posten