Learning Deep Learning: Bert testen met incident beschrijvingen 2

vrijdag 21 februari 2020

Bert testen met incident beschrijvingen 2

In een eerdere proef heb ik getest of ik (Bert) op basis van incident beschrijvingen de bijbehorende prioriteit kon voorspellen. Dat lukte behoorlijk goed. Meer dan 82 % test accuracy! (F1=70,7%)

Ook interessant is of ik het aan de juiste business service kan koppelen. Er zijn 215 business services.
Hier is een 'redelijke' verdeling in de 15K records:

GCS Helpdesk 1934
PIL O2C ERP 1612
HC One SAP R3 935
LOCAL APPS CLUSTER MED HAIFA 500
PIL B2B Service Cloud SMAX 493
HC I-IMAGING R3 491
PC Hardware 437
Philips Volcano Manufacturing Apps Service 427
Philips Store 338
...
...
Ticket Status Update 1
Gainesville Engineering Applications 1
OneDrive 1

71% test accuracy lijkt zeker niet slecht op basis van de beperkte omschrijvingen! De F1 is hier wat minder. Ik weet niet zeker welke conclusie ik hieruit moet trekken.

Eenzelfde uitdaging is het bijzoeken van de juiste assignmentgroup. Dat zijn er 394. Met hier wat voorbeelden:

'HP GERMANY OSS SUPPORT TEAM', 'PH PIC TSRD SUPPORT TEAM', 'PEAS Servicedesk', 'PH GCS OPIE Support Team', 'LOCAL APPS PCERV DIST SUPPORT', ...

Hoewel er in de 15K records ook assignmentgroepen zijn die maar 1 keer voorkomen is er verder een 'redelijke' verdeling. De grootste neemt zo'n 10% in, de tweede iets minder. Daarna gaat het redelijk snel omlaag:

WT PIL O2C ERP 1551
PH GCS ServiceMax IT Support Team 1293
WTT One IT One SAP R3 809
HC Service Max SFDC Support 493
WTT One IT I-IMAGING R3 438
PH GCS LOCAL IT SUPPORT TEAM 338
Philips Volcano Costa Rica Support Team 329
WT EAI & PI Support 288
...
...
WTT GDS SUPPLY TEAM 1
HP GLOBAL OSS SUPPORT TEAM 1
HP FRANCE OSS SUPPORT TEAM 1
TA HTC CAD Service Desk 1
WT PIL O2C AFTERCRE SLATAM 1

Kijken we naar de validatie uitkomsten dan zien we redelijk wat variatie:

>>> predicts[:20]
array([265, 229, 265, 367, 390, 349, 155, 159, 196, 349, 339, 138, 155,
303, 0, 328, 208, 353, 58, 58], dtype=int64)

Een redelijk resultaat een test accuracy van bijna 60%. De F1 ziet er hier wat minder goed uit.
De incidenten hebben ook, behalve de 'verkorte omschrijving' ook een uitgebreide omschrijving en andere metadata. Wellicht dat daarmee de accuracy nog flink omhoog te brengen is. Scheelt een hoop werk als er al een assignment en service (en prioriteits) advies gegeven kan worden.

Geen opmerkingen:

Een reactie posten

Code hulp

Numpy vstack

-----------------

ys = np.array([])

ys = np.vstack([ys, xs]) if ys.size else xs

Numpy unique (set in numpy)

-----------------

h = np.unique(x)

----

opencv : coordinaten: (hoogte, breedte)

Numpy: coordinaten: (row, column)

---

Numpy delete 'bad' rows

-----------------------------

x = x[numpy.in1d(x[:,0], bad, invert=True)]

Python sorting

-----------------

SlicLoc = sorted(SlicLoc, key = lambda x: (x[0],float(x[3])))

Pandas

----------

import pandas as pd

Td = pd.DataFrame(Tdist)

print(Td.describe())

Pickle

--------

import cPickle as pickle

with open('/Users/DWW/Documents/net1.pickle', 'wb') as f:

pickle.dump(net1, f, -1)

-------

Center of image

from scipy import ndimage

x,y = ndimage.measurements.center_of_mass(combi)

-------

reset CPU:

export LD_LIBRARY_PATH="/usr/local/cuda/lib"

export PATH=/usr/local/cuda/bin:$PATH

export DYLD_LIBRARY_PATH=/usr/local/cuda/lib:$DYLD_LIBRARY_PATH