PyData 2019: data science trends en ontwikkelingen

PyData2019_blog-Fenno

Afgelopen maand heb ik namens Ynformed naar het congres PyData London 2019 mogen gaan. PyData congressen hebben als doel om gebruikers en ontwikkelaars van data-analyse tools bij elkaar te brengen om van elkaar te kunnen leren en om te inspireren. Binnen de PyData community wordt besproken hoe Python, maar ook R (lees hier meer over het gebruik van R binnen Ynformed) en Julia, het beste kunnen worden ingezet om de uitdagingen in de data science-branche aan te kunnen. Een bezoek aan dit congres is een geweldige kans om de globale Python community beter te leren kennen en op de hoogte te blijven van de laatste ontwikkelingen in het Python ecosysteem. Wat viel mij op tijdens het PyData congres? Je leest het hieronder.

AI toepassen: je verstand blijven gebruiken

Het was meteen duidelijk dat een van de grootste uitdagingen in data science niet per se het maken van een black-box machine learning model is, maar het echt begrijpen van je probleem en de oplossing. Er zijn heel wat fouten die je kunt maken als je de data niet begrijpt en er is heel veel te winnen als je het probleem wel begrijpt en deze kennis kunt combineren met artificial intelligence. Dit is iets wat we bij onze projecten bij Ynformed ook altijd in de basis doen: het combineren van domein kennis met data science technieken. Als je wilt lezen over hoe we dat aanpakken in onze projecten kan je hier onze klantcases vinden.

Verschillende technieken

Voor mij waren de meest interessante praatjes die over een specifieke techniek die ik nog niet kende. Zo heb ik onder andere geleerd over MCMC. Dit is een manier om vanuit een statistisch model de optimale parameters te vinden. Deze aanpak combineert machine learning met statistiek om hele veelzijdige en sterke modellen te maken.

Een veel voorkomend probleem is het hebben van veel, maar onbetrouwbare data. Er werd gepresenteerd over weak supervision. Dit is een methode om onbetrouwbare data met heuristieken aan te scherpen. Dat klinkt heel nuttig, maar of dit echt werkt moet ik nog met eigen ogen zien.

Tijdens het PyData congres 2019

Plezier met Data Science

Voor mij was het heel inspirerend om te zien hoe data science ook voor minder serieuze doeleinden gebruikt kan worden. Bijvoorbeeld een camera op je fiets die achter je kijkt of er gevaar is, en rood oplicht als er een vrachtwagen achter je rijdt. (Een bus is juist minder gevaarlijk, omdat buschauffeurs een stuk beter zicht op de weg hebben.) Of het maken van een taalmodel dat vergelijkbare woorden zoekt om gedichten te veranderen. Zo kan je een gedicht van Shakespeare omzetten in ‘sciencefiction stijl’. 

Ter conclusie: Er was veel te zien en er werd een ontzettend breed scala aan onderwerpen gepresenteerd. Ik heb erg veel zin in het toepassen van wat ik gezien heb en wellicht naar de volgende editie in 2020!

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *