Case Study : To Big To Fail Company
Dans le cadre de ce projet, nous allons nous lancer dans la création de visualisation, de KPI et de modèles prédictives en partant de données fictives représentant les salariés d’un groupe international.
Pour cela, nous allons commencé par créer les données fictives en utilisant le site Mockaroo.
Création du datasets
Par la suite, nous allons créer un environnement de travaille sur JupyterLab :
Nous allons créer un notebook avec Python 3.
Importation des données
Une fois avoir défini notre environnement de travail, il nous faut importer les données :
Structure des données
Indicateur de genre dans l’entreprise
Notre première indicateur sera de définir un indicateur permettant de visualiser la répartition des genre au sein du Groupe.
Pour cela, nous allons utiliser dans un premier temps, la fonction describe()
fourni par Pandas.
Puis, nous allons génerer le KPI_Genders permettant de visualiser la proportion comme ceci :
Ensuite nous allons calculé l’écart salariale (Wage Gap)
Wage Gap
Voici un apercu de la formule permettant de créer un ratio exprimant l’écart salariale au sein du groupe :
Maintenant que nous avons notre premier KPI, nous alloons étudié un peu plus nos données.
Proportion of jobs by salaries
Voici une visualisation des métiers les plus recrutés dans le groupe :
Conclusion : On constate une grande disparité dans les métiers de ce groupe. Mais quant est-il de la disparité des salaires par rapport aux métiers que l’on retrouve dans l’entreprise ?