Comment se former à la Data Science en autodidacte

Il peut paraître difficile d’acquérir des compétences en développement, en Machine Learning ou en Data Science. Il existe pourtant un chemin à suivre pour parvenir à s’auto-former sur ces sujets, et ce chemin commence par l’apprentissage du Python et du SQL.

Dans cet article, nous allons vous présenter comment découvrir ces langages et les concepts fondamentaux du Machine Learning et de la Data Science.

Sommaire

Les connaissances de base du Data Scientist
Découvrez le Machine Learning
L’apprentissage continu de la Data Science

Les connaissances de base du Data Scientist

Pour pouvoir se former correctement, un Data Scientist en herbe nécessite de bonnes connaissance en Python et en SQL. Mais pourquoi ces deux langages en particulier ?

Parce que Python est le langage de programmation qui connaît la croissance la plus rapide, et pour de bonnes raisons. Il a un nombre incroyable de bibliothèques que vous pouvez utiliser pour des applications variées : Machine Learning, analyse de données, visualisation des données, applications web, intégrations d’API, et bien plus encore. De plus, c’est l’un des langages informatiques les plus faciles à apprendre.
Concernant SQL, il vous permet de mieux comprendre, explorer, et faire usage des tonnes de données collectées par votre entreprise. Il s’agit de plus du langage référence en matière de gestion de bases de données, tant par sa popularité que par son efficacité.

Pour finir de vous convaincre, voici un graphique de l’évolution de la popularité des différents langages (basé sur le nombre de questions vues sur Stack Overflow). On constate que Python devient une référence pour beaucoup de développeurs :

Nous avons listé pour vous les 3 meilleurs cours pour maîtriser Python et le SQL.

1. Devenez un pro de Python

Cours en autogestion et stimulant, par Zed A. Shaw
Fournit de nombreux détails et conseils pour commencer à programmer
Rend accessible un certain nombre de concepts qui peuvent paraître compliqués

2. La structure de données Pandas

Cours de Mode Analytics sur la structure de données la plus puissante de Python : Pandas DataFrame
Parfaitement adapté à l’apprentissage de l’analyse de données avec Pandas
Rappel des concepts importants de l’analyse de données en Python

3. Apprenez les fondamentaux du SQL

L’autre tutoriel de Mode Analytics pour découvrir le SQL
Permet d’apprendre toutes les notions importantes du SQL
Propose un éditeur de code et des bases de données sur lesquelles s’exercer

En complément de Mode Analytics, W3 Schools peut vous aider à répondre à toutes les questions que vous vous posez sur le SQL au fur et à mesure que vous progressez dans les tutoriels.
Nous avons également écrit un article sur les fondamentaux du SQL pour marketeurs pour vous aider à vous lancer.

Une fois que vous aurez de bonnes notions sur la manipulation des données via Python et SQL, vous serez prêt à passer au niveau supérieur.

Contactez Cartelis
pour enfin capitaliser sur vos données clients.

Cartelis vous accompagne dans le cadrage et le déploiement d'une stratégie data et CRM vraiment impactante.

Analyse client, Choix des outils, Pilotage projet et Accompagnement opérationnel.

Prendre contact avec Cartelis

Découvrez le Machine Learning

La suite idéale pour vous former à la Data Science sera de découvrir le sujet du Machine Learning. Le Machine Learning (ou apprentissage machine) est un champ d’étude de l’intelligence artificielle permettant à une machine d’évoluer par un processus systématique. Elle peut ainsi progresser et remplir des tâches plus difficiles ou problématiques que par des moyens algorithmiques plus classiques.

Pour vous permettre de découvrir ce sujet, nous avons répertorié des cours d’introduction mais également des ressources pour aller plus loin.

Les meilleurs cours d’introduction au Machine Learning

Il y a trois cours gratuits d’introduction qui sont pour nous incontournables, tous les trois chez Udacity :

Udacity – Introduction au Machine Learning : un cours qui vous enseignera l’ensemble du processus d’étude des données par le biais du Machine Learning. Il vous apprendra comment identifier et extraire les caractéristiques utiles qui représentent le mieux vos données, quelques-uns des algorithmes de Machine Learning les plus importants, et comment évaluer la performance de vos propres algorithmes
Udacity – Introduction à la statistique : présentation des techniques pour visualiser les relations dans les données et des approches systématiques pour comprendre ces relations à l’aide des mathématiques
Udacity – Introduction à la Data Science : exploration des sujets fondamentaux de la Data Science. Au programme : manipulation des données, analyse des données en utilisant les statistiques et le Machine Learning, ou encore visualisation de données

Les ressources pour aller plus loin en Machine Learning

Pour aller plus loin en Machine Learning, nous avons sélectionné les ressources qui sont selon nous incontournables.

Le livre Grokking Deep Learning fournit des exemples extrêmement clairs et fiables sur les principes fondamentaux du Machine Learning
TensorFlow, développé par Google, est une bibliothèque open source pour le Machine Learning qui peut être utilisée en Python. Elle est très puissante et vaut la peine de s’y familiariser. Consultez l’exercice MNIST pour une très bonne introduction à ce framework

Le cours CS231 de Stanford est aussi une ressource utile qui couvre les réseaux neuronaux convolutionnels (utilisés pour les logiciels de reconnaissance faciale ou d’image). Si vous êtes intéressé par l’apprentissage automatique avec des images ou des vidéos, vous ne trouverez pas mieux que ce cours
Enfin pour les plus motivés, le cours Self Driving Car Nanodegree sur Udacity est un excellent cours pour comprendre les principes de fonctionnement des voitures autonomes. C’est un cours nécessitant de la motivation mais permettant à n’importe qui de comprendre en profondeur ce sujet, à condition d’avoir acquis auparavant les autres notions que nous avons abordées

L’apprentissage continu de la Data Science

Une fois que vous aurez profondément plongé dans le Machine Learning, vous pourrez aborder la partie qui ne se termine jamais vraiment : l’apprentissage continu des différents principes de la Data Science. Pour cela, nous vous recommandons en particulier :

Le cours Data Science, Deep Learning, & Machine Learning with Python sur Udemy qui aborde le Machine Learning mais couvre aussi complètement les principes de l’Analytics, de la Data Science et des statistiques. Il présente en particulier les différentes techniques de Data Mining
Le livre Data Science For Business explique aussi très bien comment et pourquoi certains modèles fonctionnent lorsqu’il s’agit de résoudre des problèmes dans un contexte spécifique. C’est une des meilleures ressources pour relier différentes approches analytiques à des problèmes business spécifiques

FreeCodeCamp et Hackernoon publient des articles et des tutoriels sur tout ce qui concerne la Data Science et le développement

Enfin, si vous souhaitez continuer d’en apprendre encore et toujours plus sur la Data Science, nous avons deux secrets pour vous :

Construisez quelque chose. N’importe quoi. Explorez un ensemble de données. Trouvez un problème pratique auquel vous ou votre entreprise êtes confrontés et essayez de le résoudre. Même si vous n’avez pas accès à des données de bonne qualité au sein de votre entreprise, il existe de nombreux jeux de données open source avec lesquels vous pouvez vous entraîner. Vous apprendrez autant, sinon plus, en travaillant sur vos propres projets de données qu’en lisant n’importe quel cours ou livre.
Rencontrez et apprenez des gens qui ont les compétences que vous voulez acquérir. Utilisez Meetup pour trouver des groupes de professionnels de l’Analytics ou du développement proches de chez vous. Vous rencontrerez des gens très doués dans leurs domaines qui pourront vous donner des conseils et des astuces pour accélérer vos apprentissages.

CRM / Data - Plus de 15 ressources & templates gratuits à télécharger.

Découvrir

Comments

djezou says

4 septembre 2018 at 13:43

votre article est géniale. merci !

Répondre
salman says

30 décembre 2018 at 09:16

Tres bon article

Répondre
Abdoul Razak says

8 mai 2019 at 23:18

Une merveille cet article.merci
Je suis data analyst qui cherche a se spécialisé en data science

Répondre
Akuma says

2 février 2020 at 16:08

Super article, dès cet instant je suis un Data Scientist

Répondre
- Grâce divine says
  
  22 mars 2020 at 03:34
  
  Super cet article
  
  Répondre
- issifou says
  
  15 avril 2020 at 14:25
  
  Excellent article, je vien de découvrir qu’il existe des trucs comça. Je vais me lancer.
  
  Répondre
Paul-Marius says

11 février 2021 at 12:46

On a rarement eu un article aussi bon sur les différentes étapes pour se plonger dans la Data Science.
Merci beaucoup !

Répondre
Abdoulaye BA says

30 juillet 2022 at 23:10

Je viens juste, il y a trois semaine de prendre la route à suivre pour se former en autodidacte et la curiosité m’a emmené vers vous. J’avoue que je suis tombé sur la bonne voie, car j’ai rencontré quelqu’un qui a des compétences que je veux acquérir. Néanmoins, je compte utiliser Meetup pour trouver des groupes de professionnels de l’Analytics ou du développement qui pourront me donner des conseils et des astuces pour accélérer mes apprentissages. Merci beaucoup.

Répondre