woensdag 8 februari 2017

03- Lungs - histogrammen

De heb ik dus omgezet naar 1595 numpy files die op zichzelf ook weer 235gB innemen. Hmmm misschien had ik daar toch even iets langer bij stil moeten staan. Er zijn daarover ook in de kaggle competitie wat suggesties gedaan.
Elke file is genormaliseerd naar HU waarden en tevens naar dezelfde 'fysieke standaard'. 1mm x 1mm x 1mm pixels. Dus 10 pixels per centimeter. Een scan kan dan bijvoorbeeld 151 afbeeldingen van 310 x 310 pixels zijn. Dus ook evenredig met het aantal millimeters.

Ik kan nu kijken hoe de verdeling van de waardes zijn in een dergelijk blok van pixels.



Rond de -1000 is lucht en rond de nul is water. De kanker zochten we tussen -300 en -50. Dan moeten we het water waarschijnlijk voor een belangrijk deel proberen uit te sluiten. Als ik inzoom op het nulpunt denk ik dat ik HU waarden hoger dan -20 helemaal moet uitsluiten. En wellicht ook kleiner dan -330 oid. 


Ingezoomd rond nul.
De redenatie rond de gauss krommen lijkt leuk maar ik ik maar daar een denkfout. Door te vermenigvuldigen met de gauss-kromme worden de HU waarden aangepast en kruipt de hoogste frequentie rond het nulpunt. De hoogste pieken zitten echter wel rond de locaties met de te zoeken HU-waarden. Ik denk dat ik het effect alleen met een soort statistische relatie kan weergeven. Even kijken of dat lukt.
  Nog iets teveel nulwaarden erin. Ik breng de breedte terug van 150 naar 100:
En hier inclusief de emphysema en de calc. (Hoewel de laatste in de grafiek wegvalt)



 Zou het zo onderscheidende 'features' opleveren? Laat ik eens een kanker geval ernaast zetten.


Hmmm, alleen op het oog hier vooral door de emphysima. Ik ben benieuwd!!!

Hier is een beter zicht op het verschil:

Geen kanker

Wel kanker


 

Geen opmerkingen:

Een reactie posten