>>> sess = tf.Session()
can't determine number of CPU cores: assuming 4
Er blijkt echter ook sterk geïnvesteerd te zijn in tutorials. Kijk, daar hou ik van! Na wat klein spielerei probeer ik een voorbeeld van een conv2vec applicatie. Ook leuk om daar de theorie eens omheen te lezen. Hierbij worden woorden in een multidimensionale ruimte gerangschikt naar hun vergelijkbare posities (gebruik) in een zin. Of, zoals ze het daar beschrijven:
"Vector space models (VSMs) represent (embed) words in a continuous vector space where semantically similar words are mapped to nearby points"
De code is bijgeleverd inclusief het ophalen van een groot voorbeeld tekstbestand. (17.005.207 woorden). Het kopiëren hiervan in de Xcode editor gaat lastig. Python is erg gevoelig voor 'indents' (inspringingen - wat een woord) en de kopieer slag maakt er een 'zooitje van'. Maar goed na enig correctiewerk lijkt het programma weer op het voorbeeld. Lopen maar! Nu wreekt zich het ontbreken van gpu ondersteuning. Na wat eerste printregels zoals deze hieronder blijft de cursor doodstil. Blijkbaar wat geduld nodig. Het is nu woensdag 21:37. Ik ben benieuwd!
Found and verified text8.zip
Data size 17005207
Most common words (+UNK) [['UNK', 418391], ('the', 1061396), ('of', 593677), ('and', 416629), ('one', 411764)]
Sample data [5239, 3084, 12, 6, 195, 2, 3137, 46, 59, 156]
Geen opmerkingen:
Een reactie posten