De l'optimisation énergétique, avec Purecontrol ou Thrasos, à la gestion des déchets, grâce notamment à Greyparrot, en passant par la détection des fuites dans les réseaux d'eau potable et les solutions proposées par Lacroix Environnement, la majorité des domaines relatifs à la transition écologique et énergétique se sont emparés des possibilités offertes par l'intelligence artificielle pour améliorer leur process. À la manœuvre ? Les data scientists. Un profil scientifique, accessible en formation initiale ou continue, dont le travail va consister à extraire de la valeur des données, que ce soit pour travailler à la modélisation d'intelligences d'artificielles, mais aussi pour abonder des KPI ou des charts.
Formation initiale ou formation continue ?
« Après mon bac, je suis entré à l'École nationale du génie de l'eau et de l'environnement de Strasbourg, avec l'ambition de devenir ingénieur spécialisé en hydraulique. Cinq ans plus tard, je rentrais à Eau de Paris pour travailler à des missions de maîtrise d'œuvre. Sept ans après, j'y suis encore », raconte Guillaume Lellouche, maintenant data scientist chez Eau de Paris. Un profil qu'Éric Vacheret, directeur de la branche formation continue du Groupe des écoles nationales d'économie et statistique (Genes) retrouve beaucoup parmi ses étudiants : « Ceux et celles qui poussent nos portes ont généralement entre sept et quinze ans d'expérience professionnelle et un diplôme d'ingénieur ou équivalent. » Et Guillaume Lellouche de compléter : « Souvent la data science vient après la formation initiale. L'expérience a montré que les data scientists de formation initiale tendent à moins connaître le domaine sur lequel ils appliquent leur expertise. »
Cultiver ses compétences
« Travailler à la modélisation hydraulique des réseaux demande de manipuler un nombre de données assez conséquent. Pour y arriver, nous utilisons deux langages, qu'on retrouve dans le domaine de la data science : R et Python », explique Guillaume Lellouche. Une compétence qui lui a permis d'opérer plus facilement sa transition entre deux environnements techniques. Le volet statistique lui a été fourni par une formation en six mois, à l'échelle d'un bloc de trois jours tous les mois, par l'Ensae – Ensai Formation continue. Éric Vacheret indique, en outre, que cette formation inclut une demi-journée consacrée aux questions éthiques et juridiques liées à la collecte et à la protection des données.
« Il y a beaucoup de thésards parmi les data scientists », explique Maxime Carrere. Des années qu'on imagine déterminantes dans la formation théorique et pratique initiale de tout jeune professionnel, et que Maxime Carrere s'emploie à actualiser en assistant à des meet'ups sur différents enjeux. « Durant mes années de formation, le deep learning en était à ses premiers succès. J'ai travaillé sur les réseaux de neurones durant ma thèse. Depuis le Perceptron multi-couche en 1957 – ancêtre des systèmes actuels, ce sujet a considérablement évolué. Rester au courant de l'actualité dans notre domaine est vital », insiste Maxime Carrere. Une remarque dans le sens de laquelle Guillaume Lellouche abonde et indique consulter beaucoup de forums et de chaînes de discussions autour des sujets mathématiques et des langages informatiques, par exemple le canal Slack public « GRRRR », consacré au langage R.