Projet Inégalites

Problématique

Ayant un intérêt particulier pour la santé et les inégalités, j'analyserai comment ces deux enjeux sont liés. Certaines études ont déjà été faites à ce sujet mais à une échelle beaucoup plus globale, notamment The Spirit Level: Why Equality is Better for Everyone de Richard G. Wilkinson et Kate Pickett. Cette étude aura un objectif commun avec ce livre, démontrer les effets des inégalités sociales sur la santé, mais en se concentrant sur la France et en explorant des maladies précises.

Jeux de données

Les données proviennent de l'INSEE et les indicateurs ont été choisis en fonction du thème de l'inégalité tout en permettant une comparaison standardisée entre les départements :

le taux de pauvreté est plus représentatif des disparités sociales comparé à une moyenne des revenus
les taux de maladie standardisés homogénéisent les différences démographiques

Questionnement et Méthode

La méthode part d'une approche "d'enquête" : on ne sait pas a priori si toutes les maladies sont liées au niveau de vie, si il y en a plus que d'autres, lesquelles seraient-elles et pourquoi. La structure du code représente donc l'enchaînement suivant :

Phase 1 Exploration : Sélection de plusieurs maladies répandues et de nature différente
Phase 2 Focus : Visualisation pauvreté et diabète de type II
Phase 3 Approfondissement : L'obésité et l'origine sociale

Code

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import os
from functools import reduce
import seaborn as sns
import geopandas as gpd
from matplotlib.ticker import FuncFormatter

items = os.listdir('Data/geodes')

files_list = []

for file in items:
    if file.endswith('.csv'):
        files_list.append(file)

maladies = []
for file in files_list:
    df = pd.read_csv(f"Data/geodes/{file}", sep=';', header=2)
    maladies.append(df)  
``````python
pauvrete = pd.read_csv('Data/pauvrete.csv', sep=';')
pauvrete = pauvrete.loc[:, ['CODGEO', 'MED17', 'TP6017']]
pauvrete.columns = ['Code', 'Médiane du niveau de vie', 'Taux de pauvreté']

Phase 1 : Trouver les coefficients de corrélation entre le niveau de vie et plusieurs maladies

merged = reduce(lambda left, right: pd.merge(left, right), maladies)

social_data = pauvrete.merge(merged, left_on='Code', right_on='Code')

social_data

fig = plt.figure(figsize=(10, 10))

sns.heatmap(social_data.corr(), vmin=0)

Bilan Phase d'Exploration

Le constat est que le niveau de vie semble être surtout corrélé avec le diabète.

Phase 2 : Focus - Lien entre niveau de vie et diabète de type 2

fp = 'Data/Geo/Dep/departements-20140306-5m.shp'

map_df = gpd.read_file(fp)

metropole = map_df[:96]

social_data_pauvrete = social_data[['Code', 'Taux de pauvreté']]
social_data_diabete = social_data[['Code', 'Taux de prévalence standardisé de diabète traité pharmacologiquement 2016']]
social_data_diabete = social_data_diabete.rename(columns={'Taux de prévalence standardisé de diabète traité pharmacologiquement 2016':'Diabète type II'})

diabete_geo = metropole.merge(social_data_diabete, left_on='code_insee', right_on='Code')
pauvrete_geo = metropole.merge(social_data_pauvrete, left_on='code_insee', right_on='Code')

variable1 = 'Diabète type II'
variable2 = 'Taux de pauvreté'
vmin, vmax = 120, 220

fig = plt.figure(figsize=(20, 10))
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122)

diabete_geo.plot(column=variable1, cmap='Oranges', linewidth=0.8, ax=ax1, edgecolor='0.8')
ax1.axis('off')
ax1.set_title('Taux de diabète de type II', fontsize=20)
ax1.annotate('Source: INSEE, 2016', xy=(0.25, .08), xycoords='figure fraction', horizontalalignment='left', verticalalignment='top', fontsize=12, color='#555555')

pauvrete_geo.plot(column=variable2, cmap='Blues', linewidth=0.8, ax=ax2, edgecolor='0.8')
ax2.axis('off')
ax2.set_title('Taux de pauvreté', fontsize=20)

Bilan Phase 2

Les cartes du diabète et du taux de pauvreté se superposent quasiment. Pour étayer le lien entre diabète II et niveau de vie, nous l'analyserons en fonction des critères sociaux plutôt que géographiques.

Phase 3 : Approfondissement sur l'obésité et l'origine sociale

obesite = pd.read_excel('Data/surpoids 2012.xls', 'graph1', header=2, names = ['Catégorie socioprofessionnelle du père', 'Surpoids', 'Obésité'])
obesite = obesite[:9]

plt.style.use('ggplot')

fig, ax = plt.subplots()
obesite.plot(kind='barh', y='Obésité', x='Catégorie socioprofessionnelle du père', ax=ax)
plt.title("Taux d'obésité en classe de 3ème en fonction de la catégorie socioprofessionnelle du père")
Text(0.5, 1.0, "Taux d'obésité en classe de 3ème en fonction de la catégorie socioprofessionnelle du père")

Bilan Phase 3

Les adolescents les plus touchés sont ceux dont le père est ouvrier, artisan, commerçant ou chef d'entreprise.

Conclusion

D'après les graphiques, il existe une relation avec le niveau de vie pour une maladie en particulier parmis celles qui faisaient partie des jeux de données : le diabète de type II. Afin de vérifier ce lien, nous prenons des données sur l'obésité dont le lien est établi avec le diabète de type II. D'après cette analyse, il y a également une corrélation entre la classe sociale et le taux d'obésité. En conclusion, le niveau de vie a un impact sur l'obésité et le diabète de type II. Ce phénomène avait été formulé dans le livre présenté au début de cette étude.

Discussion et Critique

Naturellement, l'analyse répond à un questionnement tout en amenant un autre, pourquoi ce lien entre diabète/obésité et taux de pauvreté est-il plus marqué que les autres maladies ?

Premièrement, le système de santé français vise à atténuer les inégalités face à l'accès aux soins, ce qui peut expliquer une faible corrélation entre santé et origine sociale en général (surtout si l'on compare à d'autre pays avec un système de santé plus inégalitaire). Plusieurs hypothèses permettent d'expliquer des comportements face à la nourriture variant selon l'origine sociale. D'abord la nourriture est le confort le plus accessible, celui qui est en général préféré pour diminuer le stress. Des catégories sociales supérieures auraient accès à d'autres stratégies. Deuxièmement la nourriture moins chère est souvent de moins bonne qualité, moins nutritive avec des sucres ajoutés et donc potentiellement addictive. Dernièrement, richesse et minceur sont encore associés dans les imaginaires collectifs. Toutes ces interprétations sont basées sur des corrélations qui méritraient un étude plus approfondie étant donnée la nature intrinsèquement complexe des problèmes sociaux.

Merci pour votre lecture.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.idea		.idea
Data		Data
Projet_Inegalites		Projet_Inegalites
images		images
.DS_Store		.DS_Store
.gitignore		.gitignore
Projet_visualisation.ipynb		Projet_visualisation.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet Inégalites

Problématique

Jeux de données

Questionnement et Méthode

Code

Phase 1 : Trouver les coefficients de corrélation entre le niveau de vie et plusieurs maladies

Bilan Phase d'Exploration

Phase 2 : Focus - Lien entre niveau de vie et diabète de type 2

Bilan Phase 2

Phase 3 : Approfondissement sur l'obésité et l'origine sociale

Bilan Phase 3

Conclusion

Discussion et Critique

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Projet Inégalites

Problématique

Jeux de données

Questionnement et Méthode

Code

Phase 1 : Trouver les coefficients de corrélation entre le niveau de vie et plusieurs maladies

Bilan Phase d'Exploration

Phase 2 : Focus - Lien entre niveau de vie et diabète de type 2

Bilan Phase 2

Phase 3 : Approfondissement sur l'obésité et l'origine sociale

Bilan Phase 3

Conclusion

Discussion et Critique

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages