Fiche métier - Data Scientist
Être Data Scientist, c’est être au coeur de la valorisation des données, c’est comprendre les enjeux et les problématiques de l’entreprise autour de la donnée et proposer des méthodes et des algorithmes issues du machine learning et de la Datascience.
1/ 1 métiers, 5 missions
RECUPERER LES DONNEES
- Identifier les données à collecter et les phases de nettoyage à effectuer pour assurer la cohérence globale avant traitement des données (pour éviter les fausses informations, les informations en double, les formats différents, …).
- Développer des algorithmes de collecte et de nettoyage des données ;
- Etudier et mettre en place les meilleures solutions techniques pour gérer les grands volumes de données ;
DÉCOUVRIR LES DONNEES STATISTIQUES
- Effectuer une 1ère caractérisation des données : identifier différentes segmentations, catégories de pré-classement de donnée ;
- Qualifier la donnée sans développer de modèles prédictifs ;
- Mettre en oeuvre et développer la modélisation statistique des données ;
DÉVELOPPER LES MODELES DE PREDICTION
- Créer des algorithmes permettant d’identifier des informations prévisionnelles à partir d’une grande quantité de données, en fonction d’un objectif défini ;
- Développer des algorithmes d’apprentissage et des scénarios prédictifs ;
COMMUNIQUER
Concevoir des outils de datavisualisation, en interaction forte avec le data analyst, qui rendent visibles et lisibles les informations issues du traitement des données auprès d’interlocuteurs métier.
ASSURER LA VEILLE TECHNOLOGIQUE SUR LES ALGORITHMES ET À MOINDRE MESURE SUR LES OUTILS DE DATA SCIENCE
- Effectuer une veille sur les nouvelles technologies et solutions logicielles d’analyse des données ;
- Rechercher et expérimenter de nouvelles méthodes de modélisation et d’analyse des données. (math) ;
- Contribuer à l’évolution des pratiques dans son domaine de compétences ;
2 / Un métier de diversité
Salarié(e) d’une entreprise industrielle ou de service, il/elle travaille dans un environnement très technique. Les entreprises requièrent généralement pour des postes de data scientist des personnes ayant plusieurs années d’expérience dans le domaine du big data.
MOBILITÉ ET DISPONIBILITÉ
Le/la Data scientist est plutôt sédentaire mais il/elle peut aussi être amené(e) à se déplacer chez ses clients.
3 / Un métier, des compétences
SAVOIR
- A de solides connaissances mathématiques : Arithmétique, Algèbre linéaire, Calcul différentiel et intégral, Probabilités et Statistiques, Analyse multivariée ;
- A de solides connaissances algorithmiques : Algorithmique et Optimisation ;
- A de solides connaissances informatiques ;
- A de solides connaissances en machine learning* : régression linéaire, régression logistique, méthode des “k plus proches voisins”, arbres de décision, forêts aléatoires, machines à vecteur de support, boosting, réseaux de neurones, algorithmes génétiques ;
*machine learning = une manière de construire un algorithme qui fait de l’auto apprentissage sur la base de l’observation du passé et qui permet de résoudre des problèmes complexes
SAVOIR-FAIRE
- A de fortes aptitudes en développement / programmation : Bases de données (SQL), programmation (Python, R, Scala), Frameworks de calcul distribué (Hadoop, Spark, CUDA, …) ;
- A une excellente maîtrise du machine learning ;
- Sait utiliser des outils de Web analyse (Omniture, Google analytics etc.) ;
- Fait preuve d’intelligence économique en écoutant ses intuitions stratégiques (esprit d’entrepreneur) ;
- A une bonne maîtrise de l’anglais (converser en anglais en contexte pro.; utiliser un vocabulaire technique; comprendre de la documentation technique; écrire en anglais les livrables, notes, e-mails… nécessaires à la réalisation des activités…) ;
- Collabore fortement avec les autres membres de l’équipe (coopération et transparence permanente sur l’avancement du travail, …) ;
- compétence permettant de « travailler en équipe AGILE »
- Travaille par incrémentation et itération de 1 à 4 semaines (le processus de développement est découpé en plusieurs phases appelées des « sprint », et chaque itération répond à des objectifs courts termes) ;
- compétence permettant de « travailler en équipe AGILE »
SAVOIR-ÊTRE
- A un bon esprit d’analyse ;
- Fait preuve d’une grande honnêteté intellectuelle et de prise de recul par rapport aux méthodes utilisées pour garantir qu’elles soient adaptées au contexte des données traitées ;
- A une bonne capacité d’organisation pour structurer ses méthodes de travail et son plan d’intervention ;
- Est à l’écoute afin de recueillir avec précision les informations et les besoins des clients internes et externes de façon à mieux les satisfaire ;
- Est assez curieux pour suivre les nouvelles tendances et découvrir de nouveaux outils ;
- Est force de proposition auprès des différents acteurs de l’entreprise ;
- Sait demander de l’aide à bon escient ;
- compétence permettant de « travailler en équipe AGILE »
- Sait se contenter d’un travail individuel satisfaisant (pour faire le maximum avec les ressources allouées, sans recherche de perfection) ;
- compétence permettant de « travailler en équipe AGILE »
- A une grande capacité d’adaptation (sait rester réactif face au changement) ;
- compétence permettant de « travailler en équipe AGILE »
- Est capable de travailler dans un domaine non connu (en décalage avec son domaine d’expertise, mais toujours en gardant un lien) ;…
- compétence permettant de « travailler en équipe AGILE »
SPÉCIFICITÉS
Dans une très petite, petite et entreprise de taille moyenne (TPE / PME) : le/la data scientist sera un rôle qui pourra être cumulé avec d’autres rôles comme le/la data miner et le/la data analyst.
Dans une Entreprise de Taille Intermédiaire (ETI) ou un grand groupe : le/la data scientist est un métier à part entière qui travaillera en équipe agile avec un/e data miner et/ou un/une data analyst et plus largement l’équipe big data. Dans cette configuration, il/elle pourra aussi en plus avoir un rôle de « scrum master » (chef de projet dans le big data).
Les compétences associées au travail en équipe agile, sont plus recherchées dans les entreprises d’une certaine taille qui a une équipe big data.
4 / L’accès au métier
Il n’existe pas véritablement de voie royale menant au métier de data scientist. Il existe presque autant de parcours professionnels que de data scientists sur le marché. Le point commun est qu’ils/elles possèdent tous/toutes un bagage technique conséquent.
Les connaissances acquises sont à compléter par des expériences sur le terrain, au sein des entreprises, et par l’auto-formation, grâce à des Moocs par exemple.
Quelques exemples des diplômes les plus connus permettant l’accès au métier :
Bac +5
Master :
- Formation pilotée par Grenoble INP – Ensimag et l’EMSI Grenoble (GEM) ;
- Ecole d’ingénieurs, Master en mathématiques, physique, Informatique, actuariat ou statistiques qui aspirent à une insertion professionnelle de haut niveau ;
- Ecole d’Ingénieurs ou docteur spécialisé en analyse statistique et programmation informatique ;
- Exemple : Diplôme d’ingénieur de l’École nationale de la statistique et de l’analyse de l’information de l’ENSAI
- Filière IAMD (Ingénierie et Applications des Masses de Données) à Télécom Nancy ;
- Master 2 mathématiques pour la science des masses de données de l’école Polytechnique ;
- Master 2 « Data Sciences », Telecom ParisTech ;
- Master 2 Informatique : parcours « Data & Knowledge » et « Data Scale », Telecom ParisTech ;
- Master 2 Big Data , Polytechnique (Université Paris-Saclay) ;
- Mastère spécialisé en data sciences et business analytics de l’Essec-Centrale Paris ;
- Mastère spécialisé Big Data de Télécom Paris Tech ;
- Mastère Spécialisé « Big Data : gestion et analyse des données massives», Telecom ParisTech (→ destiné aux diplômés en poursuite d’études ou en reconversion) ;
- Mastère Spécialisé Assurance, Actuariat et Big Data, ESILV (Ecole Supérieure d’Ingénieurs Léonard de Vinci) ;
- Mastère spécialisé Big data analyse, management et valorisation responsable, ENSIMAG et EMSI Grenoble (GEM) ;
Formation continue ou VAE :
- CES « Data Scientist » proposé par Télécom ParisTech
Titre professionnel :
- RNCP 22490 : Master traitement de données volumineuses
MOOCs :
- Sur le site du MIT, de Coursera ou de Big Data University ;
- Fondamentaux pour le Big Data (IMT Institut Mines Telecom) sur FUN-MOOC ;
- The Data Scientist’s toolbox, COURSERA ;
Plateforme de concours en ligne : (pour comparer les modèles de prédiction les plus performants)
- Kaggle
- Datascience.net
Ce qu’il faut retenir
CENTRE D’INTÉRÊT
- Apprécier le travail en équipe ;
- Aimer informer, communiquer ;
- Avoir un goût pour la veille technique (technologique et mathématique) ;
- Avoir un goût pour les défis mathématiques ;
- Avoir un goût pour la recherche de solutions ;
FONCTIONS
- Production ; Maintenance ;
- Support ;
- Marketing & Commercial ;
SECTEURS D’ACTIVITÉS
La métallurgie, la chimie, l’agroalimentaire, … et plus généralement tous les secteurs d’activités de l’industrie et des services. A noter également que les métiers du big data, bien au-delà de l’industrie sont présents et très recherchés dans de nombreux autres secteurs d’activités : immobilier, santé, …
STATUTS
Salarié(e) d’une entreprise (plutôt Entreprise de Taille Intermédiaire – ETI – et grande entreprise) ou d’une société de services intervenant pour toute taille d’entreprises et notamment pour les PME.
Il/elle peut aussi être consultant/e indépendant/e.
CODE ROME*
- M1403 – Études et prospectives socio-économiques
- M1803 – Direction des systèmes d’information
- M1805 – Études et développement informatique
- M1806 – Conseil et maîtrise d’ouvrage en systèmes d’information
- M1810 – Production et exploitation de systèmes d’information
* Le Répertoire opérationnel des métiers et des emplois (ROME) est un répertoire créé en 1989 par l’ANPE (Agence nationale pour l’emploi), aujourd’hui Pôle emploi en France. Il sert à identifier aussi précisément que possible chaque métier. Ce répertoire comprend plus de 10 000 appellations de métiers et d’emplois. Cette nomenclature et la codification du ROME sont utilisées par d’autres organismes publics ou privés traitant de l’emploi. Le ROME est utilisé pour l’élaboration des familles professionnelles (FAP) en France.
Documents à télécharger
En savoir plus
PUBLICATIONS
- KEEPING UP WITH THE QUANTS, Thomas H. Davenport et Jinho Kim
- DATA SCIENCE IS A TEAM SPORT, Michael Walker
- Les métiers de la data: tour d’horizon d’un secteur d’avenir à la recherche de nouveaux talents, Camille Regache, 2017
- Big data, penser l’homme et le monde autrement, Gilles Babinet, 2016
- Data Scientist et langage R: guide d’autoformation à l’exploitation des Big Data, Henri Laude, 2016
- Big data, open data et valorisation des données, Jean-louis Monino, Soraya Sedkaoui, 2016
- Le big data: ses origines, ses outils et méthodes, ses effets, Pierre Delort, 2015
- Du big data au smart data: au service d’un monde connecté, Fernando Lafrate, 2015
- Apprentissage machine: de la théorie à la pratique – concepts fondamentaux en Machine learning, Massih-Reza Amini, 2015
Autres sources
- Le « data scientist », nouvelle coqueluche des recruteurs
- « Data scientist est un métier qui demande énormément de neurones »
- Métier de data scientist : c’est qui ? C’est quoi ?
- Data scientist, un métier d’élite en voie de démocratisation
Sites web de référence
Vidéos d’illustration du métier
- Vis mon job de data scientist (websérie, Société Générale, 2017)
- Dessine-moi un data scientist (interview de Jeremy Harroche, fondateur de Quantmetry)
Exemple d’offres d’emploi
DATA SCIENTIST JUNIOR H/F chez CGI
Entreprise CGI à Paris – 75
CGI – experience the commitment
Catégorie : Renseignements numériques/Décisionnel (Gestion des données/intelligence d’affaires)
Ville : Paris, Paris, France
Type d’emploi : Temps plein
Description du poste :
Intégré(e) à notre équipe « Valorisation de la donnée », vous participerez en qualité de Data Scientist Junior aux différentes phases de nos projets : conseil, avant-vente, cadrage des besoins, choix et optimisation des algorithmes et mise en place technique de la solution retenue. Encadré(e) par une équipe d’experts, vous serez amené(e) à intervenir sur des problématiques pointues de Data Science en utilisant, selon les choix technologiques de nos clients, des infrastructures, des outils et des langages variés : Python, Spark, R, Hadoop, MongoDB, ElasticSearch, Cassandra, Teradata,…
Fonctions et responsabilités :
Quelques exemples de missions :
- Énergie : maintenance prédictive, prévision de consommations, détection de fraudes, …
- Télécom : segmentation clients, analyse des logs, …
- Média : système de recommandations, analyse de sentiments,…
- Data Lab’ interne : veille technologique, concours de Data Science, benchmark,…
Enfin, nous attendons de vous que vous soyez moteur dans le développement de notre offre en réalisant de la veille technologique, en proposant et en développant des démonstrateurs sur notre Data Lab’ interne et que vous évangélisiez vos connaissances techniques et/ou fonctionnelles au sein de CGI.
Qualités requises pour réussir dans ce rôle :
De formation Bac+5, vous justifiez d’une première expérience dans un environnement similaire et avez acquis des compétences dans les domaines suivants :
- Manipulation de données: SQL, R, Python, Java, Scala,…
- Data Science : analyses statistiques avancées, machine learning, deep learning,…
- Une première expérience en Big Data est un plus : Hadoop, Spark, MongoDB, Cassandra,…
- Une première expérience en Data Visualisation est un plus : Qlik, Tableau, PowerBI, D3.js,…
Votre curiosité et votre rigueur vous permettent d’évoluer dans un contexte exigeant, nécessitant des qualités de communication, souvent directement avec les équipes métier du client.
Vous êtes capable de communiquer les résultats d’une analyse de manière claire, précise et efficace.
Vous savez collaborer en équipe et faites preuve de capacité d’adaptation.
Ce poste est ouvert aux personnes en situation de handicap.
Ce que vous pouvez attendre de nous :
Chez CGI, nous sommes une équipe de bâtisseurs. Chacun de nos membres (ou employés) concourt à bâtir sa propre entreprise – une firme qui regroupe 65,000 professionnels présents dans 40 pays. Fondée en 1976, CGI est un chef de file des services en TI et en gestion des processus d’affaires qui contribue au succès de ses clients. Nos clients – tout comme nos membres – peuvent compter sur nos ressources mondiales, sur notre savoir-faire, sur notre stabilité et sur nos professionnels chevronnés pour obtenir les résultats escomptés. Joignez-vous à nous. Pour en savoir davantage : www.cgi.com.
Cette offre est une excellente occasion de vous joindre à une équipe gagnante. CGI offre des conditions de rémunération avantageuses et des possibilités de croissance et de développement professionnel. Les avantages des membres permanents à temps plein entrent en vigueur dès le premier jour et comprennent des vacances payées, un régime de participation aux bénéfices ainsi qu’un régime de participation à l’actionnariat.
Nous aimerions remercier tous les candidats de leur intérêt pour notre organisation. Cependant, nous communiquerons seulement avec les candidats retenus.
Les candidatures non sollicitées provenant d’agences de placement ne seront pas retenues.
CGI favorise l’équité en matière d’emploi. De plus, CGI s’engage à offrir des accommodements aux personnes handicapées, conformément à la législation provinciale. Veuillez nous indiquer si vous vivez avec un handicap nécessitant la mise en place d’accommodements raisonnables dans le cadre de notre processus de recrutement; nous collaborerons avec vous pour répondre à vos besoins.
Découvrez les autres métiers du Big data et plus
Découvrez en détails les différents métiers d’avenir de l’industrie
Restez informé sur l’actualité des métiers et des formations dans l’Industrie du Futur
Abonnez-vous à notre newsletter et Suivez les actualités de l’Alliance Industrie du Futur.
Consultez les articles associés