Les cookies "essentiels" sont indispensables au bon fonctionnement du site.
Ils vous permettent d'accéder à toutes les rubriques, y compris celles nécessitant de s'identifier.
Ils donnent aussi des données générales d'audience et ne peuvent être désactivés.
Les autres cookies, dits analytiques, ont pour objectif une meilleure compréhension des habitudes des lecteurs.
Ils nous aident à mieux connaître vos attentes afin de vous proposer des services toujours plus pertinents.
Stage - -
Expérience : Jeune diplômé / moins de 1 an
France - Centre-Val-de-Loire - Orléans (45)
Aménagement
Description du poste
Service géologique national, le BRGM est l'établissement public de référence dans les applications des sciences de la Terre pour gérer les ressources et les risques du sol et du sous-sol. Son action est orientée vers la recherche scientifique, l'appui aux politiques publiques et la coopération internationale.
Le BRGM recherche pour sa direction (en toute lettre) unité (en toutes lettres) un(e) stagiaire pour étudier la prédictibilité du phénomène sismique.
CONTEXTE :
La prédictibilité liée au phénomène sismique constitue un enjeu important de recherche qui anime largement la communauté scientifique. Elle est par ailleurs renforcée par des perspectives applicatives importantes et une attente marquée de la société de disposer d'outils efficaces de réduction du risque sismique.
DESCRIPTIF DU STAGE :
Stage en Data Science appliquée au phénomène sismique
Attendus du stage
- Initier une base de données d'apprentissage robuste, réunissant des enregistrements sismiques (large-bandes et/ou accéléromètriques), accompagnés de nombreuses métadonnées, issus de différentes bases de données internationales (e.g. K-NET and KiK-net, PEER, ESM, etc.).
- Réaliser le code qui permet de transformer ces ensembles de données en un problème abordable par des méthodes d'intelligence artificielle (feature engineering), notamment dans un cadre d'apprentissage automatique supervisé.
- Tester plusieurs approches d'apprentissage artificiel (e.g ?random forest?, ?xgboost?, ?SVM?, ?deep learning?...) sur certaines statistiques du signal sismique, établis sur une fenêtre de temps glissante, comme caractéristiques descriptives. La sélection des données d'entrée, des caractéristiques descriptives, de la taille de la fenêtre de temps et des méta-paramètres des algorithmes de machine learning sont autant de variables du problème à déterminer.
- Réaliser le code permettant la comparaison minutieuse des résultats à travers une campagne de tests systématiques. Les données étant potentiellement très volumineuses, le test intensif et systématique de nombreux modèles engendrera probablement un problème de temps de calcul. Le cas échéant, nous projetons de prendre en compte cette difficulté en intégrant et adaptant les algorithmes d'apprentissage à un cadre de calculs distribués, comme celui proposé par l'environnement Big Data du BRGM.
Profil recherché
Compétences et qualités requises
- Solides bases en mathématiques : algèbre, statistiques descriptives et/ou inférentielles, probabilités
- Solides bases en informatique : pratique d'un langage de programmation Python ou R ; connaissance du SQL et notions en bases de données
- Capacité à travailler en équipe pluridisciplinaire (informaticiens, sismologues?)
- Capacité à présenter son travail à l'écrit et l'oral
Compétences et qualités appréciées
- Bases en data science : features engineering, algorithmes de machine learning (random forest, deep learning?)
- Bases en sismologie : Intensité macrosismique, PGA, Intensité d'Arias,
- Ville : Orléans