Challenge 3 projects

From Epidemium
Revision as of 12:41, 2 May 2018 by Ozanne (Talk | contribs) (Results)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

Challenge 3 (FR) : lire cette page en français.

Results

Projects Submitted
[March 31, 2018]
Finalist
[May 1st, 2018]
Mention
[May 26, 2018]
Prévenir pour mieux guérir | Wiki ?
Cancerinfl | Wiki ?
Osy3A | Wiki ?
Oma | Wiki ?
Octopus (Outlook on Cancer Thanks to OpenData Processing Undertaken by Students) | Wiki ?
Quelle est l'influence des variables environnementales sur le cancer du sein et du colon en Ukraine ? x - -

The registered projects

Prévenir pour mieux guérir CancerInfl
Objectif : Étudier les facteurs alimentaires pouvant influencer sur la mortalité des cancers digestifs, sur deux pays dont les régimes alimentaires et les conditions environnementales sont différents : la France, qui est un pays développé, et le Brésil.
Compétences associées : R, Python, Machine learning, Statistique.

Objectif : Prédire la mortalité des cancers gynécologiques dans les pays d’Asie en voie de développement.
Compétences associées : Python, Data cleaning, Data preparation, Machine learning, Deep learning, Database Management Systems, Data visualization, Oncologie, Génomique.
Osy3A OMA
Objectif : Prédire la mortalité des cancers digestifs dans les pays en voie de développement.
Compétences associées : Computer science, Data science.
Objectif : Prédire la mortalité des cancers de l’estomac dans les pays en développement d’Amérique du sud et centrale, ainsi que dans les pays d’Asie.
Compétences associées : Data science
Octopus (Outlook on Cancer Thanks to OpenData Processing Undertaken by Students) Quelle est l'influence des variables environnementales sur le cancer du sein et du colon en Ukraine ?
Objectif : Prédire la mortalité due aux cancers colorectaux dans les pays en développement.
Compétences associées : Python, R, SQL, Mathématiques, Physique, Statistique.

Objectif : Etudier l’influence des variables environnementales sur le cancer du sein et du colon en Ukraine.
Compétences associées : R, Data cleaning, Data preparation, Machine learning, Mathématiques, Statistique, Python, Virologie.

Challenge 3: Prediction of cancer mortality in developing countries in time and space (October 2017 - March 2018)

Challenge1 900px.png
This Challenge will strive to match cancer data with population factors (from developing countries, excluding Africa) that are thought to induce or protect against cancer, pursuing an improvement of cancer models that have rarely been explored in these regions of the world.
The focus will be on the most prevalent cancers. According to GLOBOCAN 2012, the three most prevalent cancers are lung cancer (1.8 million cases, 13.0% of all cancers), breast cancer (1.7 million cases, 11.9% of the total) and colorectal cancer (1.4 million cases, 9.7% of the total). These figures are an average, so there may exist disparities among developing countries in the incidence of cancers. An approach by continent, and possibly sub-continent, would be appreciated.
Context

Growth in developing countries (excluding Africa) imposes cancer as one of the major causes of mortality, even greater than other diseases that used to be the leading cause of death on those continents - namely infectious diseases. Thus, knowing more about cancer and its root causes, and projecting its evolution in time and space, is a decisive issue for both medical research and public health.

Given the particularity of socio-economic contexts and development models in southern countries, cancer epidemiology has, out of doubts, specific components depending on the regions of the world in which it is expressed. To date, it remains a major challenge to improve medical knowledge. And despite the fact that cancer epidemiology is being widely investigated in the northern countries, it still constitutes an uncharted scientific field of knowledge in the southern regions. Besides this, the disease approach in these latter regions is largely inspired by the existing model compensated with a North-South gradient.

Datasets

Participants will articulate their analysis from three datasets:

  • An epidemiology_dataset file for epidemiological data that includes three sub-folders (one per database collected by Epidemium: WorldBank, Faostat, Ilostat). For this Challenge 3, you can restrict yourself to the WorldBank database.
  • An incidence_dataset file that includes cancer incidence data by type of cancer. This dataset is made up of data from the WHO.
  • A mortality_dataset file that includes mortality data by type of cancer. This dataset is made up of data from the WHO.








Areas of technology
  • Statistics, Machine Learning, Big Data, Temporal Series
  • Python, R and other languages ​​and soft according to the adopted approaches (package of "forecast", tensor flow if use of Networks of Neurons, etc.)
















Suggestions de sujet de recherche :

Bâtir un modèle prédictif de la mortalité des cancers digestifs

Les cancers digestifs représentent plus d'un cancer sur cinq chez l'homme et chez la femme. Les participants ont la liberté de concentrer leur analyse sur les cancers digestifs les plus fréquents, à savoir le cancer colorectal, le cancer de l'estomac, le cancer du foie, le cancer de l'oesophage.
Il est attendu des candidats qu'ils circonscrivent un jeu d'attributs “features” qui peuvent être autant de variables possiblement explicatives. Une liberté d'agrégation des pays est laissée à la discrétion des participants, dans le sens où les modèles prédictifs peuvent être construits relativement à des groupes de pays : par exemple, par grands ensembles géographiques, économiques, par régime alimentaire, ou autre.

Bâtir un modèle prédictif de mortalité des cancers gynécologiques

Même si la létalité des cancers du sein a connu une diminution remarquable dans les pays industrialisés, d'une part, celle-ci demeure encore élevée dans le monde, d'autre part, les cancers du col de l'utérus, les cancers de l'endomètre (corps de l'utérus), les cancers des ovaires restent grevés d'une mortalité importante.

Il est attendu des candidats qu'ils circonscrivent un jeu d'attributs “features” qui peuvent être autant de variables possiblement explicatives. Une liberté d'agrégation des pays est laissée à la discrétion des participants, dans le sens où les modèles prédictifs peuvent être construits relativement à des groupes de pays : par exemple, par grands ensembles géographiques, économiques, par niveau d'éducation, ou autre.

Bien entendu, les participants seront libres de compléter les données par d'autres datasets, dès lors que ces derniers sont ouverts.

Bâtir un modèle prédictif de la mortalité du cancer du pancréas

Le cancer du pancréas est l'un des plus meurtriers, avec une médiane de survie de 8 à 24 mois (chiffre France). Le pancréas étant un organe profond, la symptomatologie est longtemps sourde et les premières manifestations perçues par les patients témoignent le plus souvent d'un stade déjà avancé. Les déterminants, les facteurs de risque de la maladie sont encore à ce jour méconnus, et il appartiendra aux participants de construire des modèles assis sur des facteurs épidémiologiques populationnels. À cette fin, il sera vivement conseillé de travailler à partir du dataset de la WorldBank qui vous est fourni.

Il est attendu des candidats qu'ils circonscrivent un jeu d'attributs “features” qui peuvent être autant de variables possiblement explicatives. Une liberté d'agrégation des pays est laissée à la discrétion des participants, dans le sens où les modèles prédictifs peuvent être construits relativement à des groupes de pays.

Bien entendu, les participants seront libres de compléter les données par d'autres datasets, dès lors que ces derniers sont ouverts.