Nieuwe uitdaging: Data Science

Onlangs heb ik mijn tanden gezet in een nieuwe opdracht. In samenwerking met het Centre for Innovation van Universiteit Leiden werk ik de komende tijd aan verschillende Data Science projecten. Een mooie uitdaging. Ik geloof namelijk dat Data Science de komende jaren enorm groot gaat worden binnen de ICT.

Het vakgebied Data Science staat nu nog in de kinderschoenen en er zijn weinig experts. Maar zeker als je kijkt naar de mogelijkheden van de huidige technieken, geloof ik dat Data Science alleen maar groter en groter zal worden.

Dankzij Data Science kan de politie straks bijvoorbeeld voorspellen waar rellen zullen ontstaan. Of denk aan supermarkten die kunnen voorspellen waar ze hun producten het beste kunnen plaatsen voor zoveel mogelijk winst.

Meer doen met data

We gaan dus onderzoeken welke mogelijkheden er allemaal zijn binnen Data Science. De kennis en ervaring die we hiermee opdoen, kunnen we dan weer gebruiken om andere bedrijven ervan te overtuigen om meer met hun data te gaan doen, zodat ze er meer waarde uit kunnen halen.

Momenteel werk ik aan een Twitter-analyse voor Human Rights Watch Momenteel werk ik aan een Twitter-analyse voor Human Rights Watch

Eerste project: Twitter-analyse

Het huidige project waar ik aan werk is een Twitter-analyse voor Human Rights Watch. Zij willen inzicht krijgen in hoe hun tweets bij specifieke ‘target accounts’ terechtkomen en hoe ze hun Twitter-gebruik kunnen aanpassen om meer targets te bereiken.

Door Twitter-accounts te classificeren, krijgen we een goed beeld van de target groups van Human Rights Watch. Ook analyseren we op welk tijdstip tweets het beste uitgestuurd kunnen worden, voor optimaal bereik. Tot slot analyseren we de content van tweets, om te zien of bepaalde tweets beter hun doel bereiken dan anderen.

Ervaring en kennis opdoen

Het uiteindelijke doel is om ervaring op te doen in Data Science. Die kennis kan ik weer delen binnen Qualogy, zo laat ik mijn bevinding elke week aan mijn collega’s van Qafe via een demo zien.

350 miljoen tweets classificeren

Binnenkort ga ik ook meedraaien met een nieuw project voor het classificeren van meer dan 350 miljoen tweets. Ik ga dan na hoeveel tweets van mannen afkomstig zijn en hoeveel tweets worden uitgestuurd door vrouwen.

Hiervoor gaan we verschillende zaken analyseren om zo tot een zo goed mogelijke classificatie te komen. Zo kijken we naar de profile picture, profile name en followers. Maar over dit project vertel ik graag meer in een volgende blog!

Pim: “Zeker als je kijkt naar de mogelijkheden van de huidige technieken, geloof ik dat Data Science alleen maar groter en groter zal worden”