PEUT-ON DEVENIR DATA SCIENTIST SANS DIPLÔME D’INGÉNIEUR ?

Beaucoup pensent que la Data Science est une discipline réservée à une élite dotée d’un solide bagage en mathématiques et en code. Passionné par l’intelligence artificielle mais issu d’une formation commerciale, Antoine Krajnc a découvert la Data Science sur le tas et nous prouve le contraire ! Il nous raconte comment il est passé d’autodidacte à enseignant, avant de créer Jedha, son propre bootcamp de Data Science, et livre ses conseils à ceux qui souhaitent se lancer dans ce domaine fascinant.
Portrait d'Antoine Krajnc, fondateur de Jedha, bootcamp de data science. Il explique comment devenir data scientist.

On ne le réalise pas forcément mais on a déjà un bon background mathématique !

Mais au fait, la data science, c’est quoi ? 


Quand tu crées un produit dans la tech, tu collectes des données. Prenons l’exemple d’un formulaire sur un site, qui sera rempli d’informations par des utilisateurs : ça crée de la donnée. Au fur et à mesure que ton site grandit, tu en collectes de plus en plus et tu peux faire plein de choses avec, comme améliorer ton expérience client par exemple. Dans le cas d’un produit technologique, tu peux savoir comment les gens naviguent sur ton site, ce qu’ils achètent… La Data Science a été popularisée par les GAFA, notamment Facebook et Google, qui collectaient les nombreuses images postées par les utilisateurs. Une image est constituée de pixels, qui ont une valeur. C’est donc de la donnée, et tu peux entraîner des algorithmes à reconnaître ce qu’il y a sur ces images. Les gens ont donc commencé à s’y intéresser. Avant, on avait besoin d’ordinateurs dotés d’une grosse puissance de calcul, mais maintenant tu peux le faire toi-même. Ça ouvre donc beaucoup de portes !

Raconte-nous ton parcours avant Jedha.


J’ai fait une école de commerce à Nantes. J’ai appris beaucoup de choses liées au management mais j’étais surtout intéressé par la tech. Mes premiers stages ne me correspondaient pas vraiment et je me suis dit qu’il fallait que j’apprenne quelque chose qui me plaise. J’ai commencé à coder sur des sites comme teamtreehouse.com. Ça m’a plu et je n’ai jamais arrêté en 5 ans ! Au fur et à mesure j’ai appris d’autres langages : JavaScript, PHP, Ruby… J’ai un peu touché à tout. Puis je suis parti aux US : je voulais apprendre l’entrepreneuriat, découvrir la l'univers de la tech, et pour moi il n’y a pas mieux que là-bas pour ça. 

Comment as-tu découvert la Data Science ?


Quand j’étais à San Francisco, le truc en vogue c’était le Machine Learning, tout le monde en parlait, ça me faisait rêver ! J’ai voulu apprendre cette discipline. J’ai alors découvert Python et j’ai trouvé ça incroyable. Tu comprends enfin pourquoi tu as appris les statistiques en prépa. Ça te permet par exemple de créer des algorithmes de reconnaissance d’image et d’aller beaucoup plus loin dans l’automatisation.

Ne sois pas intimidé(e) ! Aujourd’hui on a les outils : avec ton ordi, tu peux faire de la Data Science, et les techno disponibles font que tu n’as pas besoin d’être super bon(ne) en math pour pouvoir modéliser des équations compliquées.

On peut vraiment devenir Data Scientist après un bootcamp ? Quels sont les différents métiers de la Data Science ?


Oui, chez Jedha on a 90% de taux de retour à l’emploi. Les débouchés sont majoritairement en tant que Data Scientist, Data Analyst et Data Engineer.
  • Le Data Scientist voit tout le pipeline data : il s’occupe de la collecte, du nettoyage, et de l’analyse des données. Il a une compréhension assez profonde de la statistique, un fort esprit analytique et une bonne connaissance métier.
  • Le rôle du Data Analyst se situe plus en aval du pipeline data : la donnée est déjà collectée et il n’a plus qu’à s’en servir. 
  • Le Data Engineer est celui qui crée le pipeline data et ses outils, ceux qui permettent de collecter et de nettoyer les données par exemple. 
Pour assurer cette employabilité, on s’est concentré sur la reconnaissance des entreprises. On a voulu bien former nos élèves sur des tâches précises, opérationnelles, qu’ils rencontreront dans les boîtes via des cas concrets d’entreprise. Il peut s’agir par exemple d’entreprises comptables qui nous soumettent des projets de scrapping où l’enjeu est d’aller chercher des données sur le net pour les analyser, ou bien des projets sur la fraude dont le but est de capter si un paiement par carte est frauduleux sur internet. On les coache aussi sur l’aspect carrière, pour qu’ils passent les barrières des entretiens techniques et de personnalité facilement. Ensuite quand ils sont en poste, leur progression est assez rapide. 

Quels conseils donnerais-tu à quelqu’un qui veut se lancer dans la Data Science ?


  • Commence par le code et pas par les maths. La première crainte que les gens ont en Data Science, c’est qu’il y ait trop de statistiques, et que ça leur rappelle des mauvais souvenirs de cours de maths. Mais en réalité, connaître la notion de moyenne et médiane de suffit presque. On ne le réalise pas forcément mais on a déjà un bon background mathématique. Ce qui pèche, c’est le code. Apprendre à coder en Python et R qui sont assez populaires en Data Science, mais je conseille plutôt Python, qui est plus polyvalent et dont les technologies évoluent plus vite.
  • Pratique, pratique, pratique. Il y a des plateformes comme Kaggle.com proposant plein de jeux de données sur lesquels on peut s’amuser. Ça te permet aussi de te créer ton portfolio de projets (idéalement sur Github), et donc à la fois d’asseoir tes compétences en code, mais aussi de montrer aux recruteurs ce dont tu es capable. 
  • Sois au fait de ce qui se passe, les techno évoluent très vite dans la Data Science. C’est bien de s’abonner à quelques personnalités qui évoluent dans cet univers, comme Jeremy Howard, le fondateur d’une library de Deep Learning sur la reconnaissance d’image qui s’appelle FastAI, le Deep Learning étant une branche du Machine Learning. La Data Science demande beaucoup de puissance de calcul donc on évite souvent de partir de zéro et on utilise des "libraries" : c’est comme du code pré-fabriqué dont tu peux te servir. Tu pars d’un template qui n’est pas vierge et te permet de créer beaucoup plus rapidement. Il y a aussi les libraries de Google, TensorFlow et enfin Yann LeCun, un Français qui a inventé les réseaux de neurones. C’est le papa du Deep Learning !
  • Ne sois pas intimidé(e) ! Aujourd’hui on a les outils : avec ton ordi, tu peux faire de la Data Science, et les techno disponibles font que tu n’as pas besoin d’être super bon(ne) en math pour pouvoir modéliser des équations compliquées. La Data Science est plus accessible et c’était mon pari avec Jedha. N’importe qui, avec un peu de motivation, peut se lancer. Moi, ça m’a pris 5 ans, mais maintenant avec des bootcamps tu peux faire ça en 3 mois. Un de mes Alumni est devenu hyper pointu en reconnaissance d’image, sans background spécifique en math. Il faut un peu de bonne volonté et d’huile de coude mais c’est aussi possible que se lancer en développement web !

Vous voulez devenir Data Scientist, Data Analyst ou Data Engineer ? Trouvez votre formation en Data Science sur Telescope ! On vous accompagne vers les nouveaux métiers de la tech et du management aussi sur Twitter, Facebook, Instagram et LinkedIn : suivez-nous !

Découvrir les écoles