Challenge 3 (FR)

From Epidemium
Jump to: navigation, search
Challenge1 900px.png
Challenge 3 :
Prédire dans le temps et dans l’espace la mortalité des cancers dans les pays en voie de développement (PED)

Octobre 2017 - Mars 2018


Ce Challenge vous invite à apparier des données du cancer à des facteurs populationnels (des pays en développement, hors Afrique) pressentis comme des facteurs inducteurs ou protecteurs, afin d'affûter des modèles d’évolution du cancer encore peu explorés dans ces régions du monde.
On s’intéressera aux cancers les plus fréquents. Selon GLOBOCAN 2012, les trois cancers les plus fréquents sont le cancer du poumon (1,8 million de cas, 13,0 % du total des cancers), le cancer du sein (1,7 million de cas, 11,9% du total) et le cancer colorectal (1,4 million de cas, 9,7% du total). Bien entendu, ces chiffres sont une moyenne, et il peut y avoir des disparités dans la fréquence des cancers dans les PED. Une approche par continent et éventuellement sous-continent sera appréciée.
Contextualisation :

La croissance qui porte les pays en développement (hors Afrique) impose le cancer comme l’une des causes majeures de mortalité, au devant même des maladies qui sur certains continents étaient la cause première de mortalité, à savoir les maladies infectieuses. Mieux connaître le cancer, ses déterminants et projeter son évolution dans le temps et dans l’espace est un sujet décisif tant sur le plan de la recherche médicale qu’au plan de la Santé publique.

Compte tenu de la particularité des contextes socio-économiques et des modèles de développement des pays du Sud, l’épidémiologie du cancer a sans doute des composantes spécifiques selon les régions du monde dans lesquelles elle s’exprime. Elle demeure à ce jour un vaste enjeu d’amélioration de la connaissance médicale. Car, si l’épidémiologie du cancer dans les pays du Nord est largement investiguée, elle constitue un terrain de connaissance scientifique en friche pour ce qui est des pays du Sud, et l’approche des maladies dans ces dernières régions s’inspire largement de la déclinaison de modèle selon un gradient Nord-Sud.

Jeux de données :

Les participants articuleront leur analyse à partir de trois datasets :

  • Un dossier epidemiology_dataset pour les données épidémiologiques qui comprend trois sous-dossiers (un par base de données collectées par Epidemium : WorldBank, Faostat, Ilostat). Pour ce Challenge 3, vous pouvez vous restreindre à la base de donnée WorldBank.
  • Un dossier incidence_dataset qui comprend les données d’incidence des cancers par types de cancer. Ce dataset est constitué à partir des données de l’OMS.
  • Un dossier mortality_dataset qui comprend les données de mortalité par types de cancer. Ce dataset est constitué à partir des données de l’OMS.






Domaines de technologies :
  • Statistiques, Machine Learning, Big Data, Séries Temporelles
  • Python, R et autres langages, et soft selon les approches adoptées (package de “forecast", tensorflow si usage de Réseaux de Neurones,...)