maandag 25 februari 2019

Matters that matter IV

Het probleem met de verschillende OneHot uitkomsten zit vermoedelijk in het type dat tussendoor wordt gebruikt. (uint8). Hoewel er geen fouten ontstaan heeft dit datatype onvoldoende ruimte om de OneHot van > 30K woorden 'weer te geven'.
Ik heb de vraag overigens hier nog uitstaan.



Inmiddels werkt het model als een 'zonnetje', ook in een Sequential Keras implementatie:



De resultaten zijn veel belovend. Ik test het effect als ik het model 2x zo klein en 2x zo groot maak.


2x zo klein model
2x zo groot model
Het model heeft dus echt wel zijn omvang nodig om de variatie in de teksten goed vast te kunnen leggen. 

Geen opmerkingen:

Een reactie posten