Meetup « Big Data » à la Mutinerie

meetup_big_dataGoogle, Facebook, Twitter ont fondé leur succès sur l’analyse de la Data. Mais au fond qu’est-ce que la data? Une température, une donnée GPS, un nombre d’affichages, un avis client…? Fondamentalement, toute information qui persiste dans le temps a vocation à être une « data« . A l’heure où les technologies de capture sont au point, sommes-nous réellement en mesure d’en tirer parti afin de prendre de meilleures décisions ? Pouvons-nous nous servir de la data afin de mieux comprendre le monde qui nous entoure ? Ces questions étaient l’objet du meetup « Big Data » qui a eu lieu hier soir à la Mutinerie et auquel l’équipe technique de Verteego a eu le plaisir d’assister.

Force est de constater que les algorithmes de machine learning ne sont pas encore à la portée de tous. En effet, ces algorithmes sont utilisés dans 90% des cas dans la BI ou dans la finance alors que 90% des besoins se trouvent dans la vie de tous les jours des entreprises et des personnes.

Francisco Webber, ancien universitaire et fondateur de la startup viennoise Cortical.io, nous a parlé de sa solution de programmation neuro-linguistique (NLP) pour la compréhension automatisée de textes. C’est probablement dans ce domaine que des avancées sont les plus attendues ces prochaines années…
Citons par exemple la recommandation d’amis sur Facebook, les moteurs de recherche de type Google, ou la confection intelligente de résumés. La technologie développée par la startup de Francisco Webber pourrait par ailleurs constituer un pas décisif vers la traduction automatique d’un texte d’une langue à l’autre, un domaine dans lequel les algorithmes actuels sont encore loin d’être efficaces. Selon l’orateur, il suffit de reproduire le plus fidèlement possible les mécanismes connus du cerveau humain. On utilise une approche géométrique afin d’associer à chaque mot une « empreinte » qui reflète les zones activées du réseau de neurones. Par exemple, l’empreinte du mot « orgue » se superpose avec celle du mot « piano », qui fait partie de la même famille d’instruments, et celle du mot « église » dans laquelle on l’entend le plus souvent. Cette expérience coïncide avec celle réalisée avec des électro-encéphalogrammes sur des cerveaux humains et on peut alors supposer que la NLP nourrira un jour la recherche en neurologie.

Dans un style tout à fait différent, Olivier Coradi nous a présenté les derniers projets de la startup française Snips pour laquelle il travaille en tant que Data Scientist. Si vous ne connaissez pas Snips, sachez que c’est elle qui a mis au point « Tranquilien » lors d’un hackathon organisé par la SNCF. Rappelons que cette application permet aux usagers des transports en communs d’avoir des prévisions de l’état du trafic en temps réel. Ce programme intègre à la fois les remontées des usagers et un module « prédictif » basé sur des algorithmes de machine learning. Les projets actuels de la société s’orientent vers l’intégration de la Data contextuelle afin de rendre intelligentes nos applications mobiles préférées (agenda, sorties, etc).

La soirée a été organisée par la société Dataconomy qui réalise régulièrement ce type d’événement à travers l’Europe.