woensdag 21 oktober 2015

Foute bussen - deel negen - Toch nog beter

Hoewel ik vorige keer eigelijk een punt achter de 'foute bussen' had gezet en inmiddels bezig ben met wat complexere medische data kon ik het niet laten toch nog verbeteringen in te voeren. De gemiddelde afwijking van een halve kilometer was een grote verbetering maar, gezien ook de relatieve eenvoud van route 22 zou het veel beter moeten kunnen.
Eerst maar eens nieuwe data laden inclusief een datum. Dat voorkomt dat tijden van verschillende dagen door elkaar gehusseld worden. Een fout die ik al gemeld had maar maar beperkt achteraf heb kunnen corrigeren.
Een datum-tijdveld wordt nu zo opgeslagen:


"20151021 12:05 AM"

Ook nog eens goed naar AM en PM tijden gekeken. Eenvoudig 12 uur optellen bij PM tijden blijkt niet helemaal goed. Tussen 00:00 en 00:59 (AM) wordt de tijd weergegeven als 12:XX Dus bijvoorbeeld 12:35 AM. Hetzelfde gebeurd tussen 12:00 en 12:49 hetgeen met 12 erbij bijvoorbeeld tot 24:45 PM kan leiden. Ook dus maar gecorrigeerd.  

Na enkele dagen de webservice elke 2 minuten leegzuigen kunnen we de boel weer laten draaien. Een beetje tweaken aan de parameters geeft nu een volgend resultaat:

count  1906.000000
mean      0.329606
std       0.206381
min       0.006579
25%       0.188810
50%       0.288062
75%       0.419695
max       2.791522

Een gemiddelde van 0.33 kilometer. Weer een stuk beter!  Toch nog eens denken of het nog beter kan. Op het oog moet het nog juister voorspellen van de route toch eenvoudiger zijn. Het lineair doortrekken van de betreffende coordinaten:


Misschien kan een re-current netwerk beter werken. Of wellicht 'specialisten netwerken' (Een voor de lengte- en een voor de breedtegraad?)

Geen opmerkingen:

Een reactie posten