Bij de eerdere diagnostische data zit geen echte classificatie. Een superviced netwerk training wordt daarmee dus lastig. Wel zit er een geschreven toelichting en een conclusie bij. Daarin wordt regelmatig vergelijkbare terminologie gebruikt zoals 'ernstig' en 'fors'. Het moet dus mogelijk zijn om een classificatie af te leiden. Enerzijds probeer te classificeren tussen wat 'ernstig is en wat niet. Anderzijds probeer ik een meer gedetailleerde classificatie te maken op waar het 'ernstig' op slaat.
Ik selecteer op de woorden:
slecht = ['slecht','slechte', 'fors', 'forse', 'ernstig', 'ernstige', 'abnormaal', 'abnormale', 'gigantisch', 'gigantische', 'massale', 'massaal', 'dramatisch','dramatische', 'enorm', 'enorme']
De 'negatie' daarvan test ik ook:
neg = ['niet', 'geen' , 'enig', 'enige', 'wat', 'iets', 'wat', 'geringe', 'matige']
Soms hebben de 'slecht-woorden' betrekking op de beeld of meting kwaliteit. Ik haal die er zoveel mogelijk uit.
meting = ['afgrensbaar', 'opneembaar','waarneembaar','te', 'echovenster', 'echodens', 'beeld', 'patient', '-', 'echobeeld', 'beeldkwaliteit', 'echovensters']
En daarna probeer ik het woord voor of na als detail klasse te selecteren. Uiteraard zitten daar door de verschillende schrijfwijzen veel missers in. Eerst nu maar eens kijken of ik de hoofdclassificatie ernstig of niet kan aanleren. Met een eenvoudig neuraal netwerk op basis van Lasagne kom ik uit op ongeveer 80% betrouwbaarheid. Hoewel er altijd gestoei is met de programmafouten merk ik wel dat ik meer routine begin te krijgen.
Geen opmerkingen:
Een reactie posten