Monday, January 5, 2009

2009 het jaar van 'Analytics'?door Jos van Dongen

2009 het jaar van 'Analytics'?Jos van Dongen

Een bekend gezegde luidt dat voorspellen erg lastig is, vooral als het over de toekomst gaat. Desalniettemin roep ik hierbij ook mijn medebloggers op om hun overpeinzingen voor het komend jaar in een blogpost te vertalen. Mijn kleine bijdrage is de hoop en verwachting dat ook in Nederland het onderwerp 'Analytics' hoger op de BI agenda komt te staan. Voor wie nu al met de ogen zit te knipperen: het gaat hierbij om een verzameling tools en technieken die vaak onder het kopje 'data mining' en 'statistiek' zijn terug te vinden. Inderdaad nog steeds geen onderwerp voor een 'dummies' boek, maar wie weet! De aandacht is vooral ontstaan als gevolg van het verschijnen van 'Competing on Analytics' van Jeanne Harris en Thomas Davenport. Mocht u het boek nog niet gelezen hebben: meteen bestellen! Een alternatief en prima introductie in de vorm van 'Future Bright: reinventing performance' kunt u overigens ook bij SAS verkrijgen, en nog gratis ook! Dan nu de onderbouwing: data warehousing, olap en rapportage hebben we zo langzamerhand wel redelijk in de vingers (ik gebruik bewust de term 'redelijk' omdat er links en rechts nog een hoop valt te verbeteren, maar we komen er wel) en begint steeds meer een 'hygiëne factor' te worden. Met andere woorden: een DWH is inmiddels verworden tot een voorwaarde om 'mee' te kunnen doen, maar niet meer voldoende om het verschil te maken in de markt. De organisaties die in Competing on Analytics worden beschreven maken dit verschil wèl, en let op: een tip top data management infrastructuur en organisatie was voor deze clubs slechts het begin. Het gaat er uiteindelijk om wat je met al die data doét, en daar kan analytics een beslissende rol in spelen. U kunt hiervoor hele dure tools aan gaan schaffen en dito trainingen gaan volgen, maar er is in 2009 nog een onmisbare trend: de portemonnee zit dicht. Erg? Nee hoor! U begint gewoon met Excel (of natuurlijk OpenOffice Calc) want dat heeft u toch al en plakt daar om te beginnen de open source Palo database onder. Palo is een zeer eenvoudig te installeren en gebruiken in memory OLAP database waardoor u in een paar minuten over een zeer krachtige analyse oplossing beschikt. Data laden hoeft ook geen probleem te zijn: zowel de open source ETL tools Kettle en Talend beschikken over een Palo output connector en is een full-blown ETL tool te veel van het goede kunt u ook de freeware Imp:Palo versie van Cubeware importer gebruiken. Dan het data mining stuk: hoewel Excel 2007 beschikt over prachtige mogelijkheden om de dm functionaliteit van MS Analysis Services te gebruiken moet dat wel beschikbaar zijn of worden ingericht. Simpeler (en zeker voordeliger in aanschaf) is de installatie van RExcel dat ervoor zorgt dat de statistische 'R' library als helper application beschikbaar wordt gemaakt binnen Excel.

Uw totale investering voor dit complete analytische pakket? 0 Euro en een beetje tijd. Als dat geen goed begin is van 2009 weet ik het ook niet meer.
 

No comments: