|
PUBLICATIES |
|||||||||||
| Profijtbeginsel
aan de balie Door Chris den Daas, managing partner bij iTEM Consultants, Zeist Het zal de regelmatige lezer van deze column ongetwijfeld zijn opgevallen dat er nogal veel aandacht wordt besteed aan het fenomeen DataWarehousing. Dit is niet zo vreemd als je nagaat dat DataWarehousing een van de meest prominente trends in automatiseringsland is. Het aardige van DataWarehousing is dat het de brug slaat tussen de (traditionele) automatisering en de bedrijfsstrategie van een onderneming. Dit is eigenlijk heel logisch als je stilstaat bij wat een DataWarehouse feitelijk is: een gegevensverzameling met een verzameling toepassingen, die het beslisproces van managers kan ondersteunen. Anders dan bij traditionele toepassingen, die ten doel hebben om specifieke bedrijfsfuncties zoals het administreren van verzekeringspolissen of het verwerken van betalingen te ondersteunen richt het DataWarehouse zich op het verschaffen van inzicht in de totale performance van een organisatie. Dit stelt hele andere eisen met betrekking tot de kwaliteit van gegevens. De kwaliteit van de gegevens wordt inmiddels erkend als de kritieke succesfactor voor het welslagen van een DataWarehouse-implementatie. Waarom is dit nu zo en welke activiteiten moeten er worden ondernomen om de kwaliteit van de gegevens te borgen? Een DataWarehouse "betrekt" zijn meeste gegevens vanuit de bestaande transactiesystemen van de organisatie. Deze gegevens zijn vaak vervuild. Naast de "gewone" vervuiling, zoals bijvoorbeeld onvolledig of verkeerde naw-gegevens, zijn er ook vaak gegevens bewust niet of verkeerd ingevuld. Uit onderzoeken is gebleven dat de geboortedata in relatiebestanden bij banken in 80% - 90% niet of foutief is ingevuld. Voor de operationele systemen is dit over het algemeen helemaal geen probleem. Het is immers nauwelijks relevant om te weten hoe oud een bepaalde klant is; als zijn saldo maar correct is! De marketingmanager, die het DataWarehouse raadpleegt, bijvoorbeeld omdat hij wil onderzoeken of er markt is voor een nieuw pensioenproduct is echter wel in de leeftijdsinformatie geïnteresseerd. Bij het vullen van het DataWarehouse dient er
een kwaliteitscheck op de gegevens te worden uitgevoerd. Hiervoor is een aantal
geautomatiseerde hulpmiddelen ontwikkeld - ik denk aan gespecialiseerde software van
bedrijven als Human Inference, Carleton en PRISM. Maar bovenal is het zaak dat zogenaamde
"interpretatieteams", bestaand uit materiedeskundigen die in staat zijn om te
beoordelen of de inhoud van gegevens stroken met de werkelijke situatie, de gegevens
valideren. |