Votre navigateur n'est pas à jour et ne peut pas afficher cette publication.
En savoir plus

Faire parler la data

Gilles Faÿ ne passe pas toutes ses journées à manier les langages open source du machine learning (apprentissage statistique), comme Python ou R. Il se déplace régulièrement sur le terrain à la rencontre des « opérationnels » pour comprendre leurs attentes et leurs besoins. « La moitié du chemin est faite quand la bonne question est formulée », dit-il.

Son travail sera ensuite d essayer d y répondre et de se demander s il est possible d y arriver avec les données. « Mais avoir des données ne suffit pas, ajoute Gilles Faÿ. Celles-ci peuvent n être que du bruit, des données sales ou partielles. » C est là que le data scientist entre en jeu : « Notre but est de faire parler les données, et on commence par les nettoyer, les réorganiser, les filtrer. »

L équipe du CIRSEE n a pas pour mission de réinventer le machine learning, mais utilise les algorithmes disponibles pour « mettre le tout en musique ». Même si la volonté est de former au maximum les métiers de SUEZ pour les rendre plus indépendants dans l interprétation des résultats, cette étape requiert encore des professionnels de la statistique. « Sinon il est très facile de faire dire n importe quoi aux données. »

Assis face à ses grands écrans d ordinateur, Gilles Faÿ a les yeux rivés sur des tableaux de données et des lignes de codes. Avec lui, trois autres personnes composent l équipe de data scientists du Centre international de recherche sur l eau et l environnement (CIRSEE), l un des centres de compétences du groupe SUEZ mobilisés pour une gestion innovante des ressources. « J y travaillais depuis deux ans, lorsque le poste a été créé, dit l expert. Avant, j étais professeur des universités en mathématiques appliquées. » Preuve de l intérêt pour les sciences des données, l effectif de l équipe pourrait doubler d ici fin 2018.

En dix ans, la discipline a en effet pris une part de plus en plus importante dans les stratégies de gestion des ressources : scénarios prédictifs, identification des failles pour optimiser les rendements, amélioration des profils clients Le data scientist se situe au cœur de ces questionnements, tirant profit des masses immenses d informations disponibles provenant de toutes sortes de sources : opérationnelles, météorologiques, bases clientèles (industriels et particuliers), images satellitaires, vidéos de surveillance, etc. SUEZ compte ainsi près de trois millions de compteurs d eau communicants déployés dans le monde, collectant plusieurs fois par jours des index de consommation d eau par le biais d un émetteur radio.

Réunissant des compétences aussi variées que les mathématiques, la statistique, la programmation ou encore l ingénierie informatique, le data scientist fait partie des perles rares pour les recruteurs.

Gilles Faÿ Expert en data sciences, SUEZ

©

Gi lle

s Fa

ÿ

Salle de contrôle de l usine d eau potable de SUEZ à Tianjin, Chine

© S

U E

Z /

A BA

C A

P R

E S

S /

P at

ri ck

W ac

k

59