Robots
Cookies

Préférences Cookies

Nous utilisons des cookies sur notre site. Certains sont essentiels, d'autres nous aident à améliorer le service rendu.
En savoir plus  ›
Menu mobile Emploi Environnement
Fermer le menu mobile

Mon compte

recherche Emploi Environnement

Cette offre n'est plus disponible

Offre plus disponible

Stage en Data Science H/F

Mise à jour le 13/02/2018

Description du poste

Service géologique national, le BRGM est l'établissement public de référence dans les applications des sciences de la Terre pour gérer les ressources et les risques du sol et du sous-sol. Son action est orientée vers la recherche scientifique, l'appui aux politiques publiques et la coopération internationale.

Le BRGM recherche pour sa direction (en toute lettre) unité (en toutes lettres) un(e) stagiaire pour étudier la prédictibilité du phénomène sismique.

CONTEXTE :
La prédictibilité liée au phénomène sismique constitue un enjeu important de recherche qui anime largement la communauté scientifique. Elle est par ailleurs renforcée par des perspectives applicatives importantes et une attente marquée de la société de disposer d'outils efficaces de réduction du risque sismique.

DESCRIPTIF DU STAGE :
Stage en Data Science appliquée au phénomène sismique

Attendus du stage
- Initier une base de données d'apprentissage robuste, réunissant des enregistrements sismiques (large-bandes et/ou accéléromètriques), accompagnés de nombreuses métadonnées, issus de différentes bases de données internationales (e.g. K-NET and KiK-net, PEER, ESM, etc.).
- Réaliser le code qui permet de transformer ces ensembles de données en un problème abordable par des méthodes d'intelligence artificielle (feature engineering), notamment dans un cadre d'apprentissage automatique supervisé.
- Tester plusieurs approches d'apprentissage artificiel (e.g ?random forest?, ?xgboost?, ?SVM?, ?deep learning?...) sur certaines statistiques du signal sismique, établis sur une fenêtre de temps glissante, comme caractéristiques descriptives. La sélection des données d'entrée, des caractéristiques descriptives, de la taille de la fenêtre de temps et des méta-paramètres des algorithmes de machine learning sont autant de variables du problème à déterminer.
- Réaliser le code permettant la comparaison minutieuse des résultats à travers une campagne de tests systématiques. Les données étant potentiellement très volumineuses, le test intensif et systématique de nombreux modèles engendrera probablement un problème de temps de calcul. Le cas échéant, nous projetons de prendre en compte cette difficulté en intégrant et adaptant les algorithmes d'apprentissage à un cadre de calculs distribués, comme celui proposé par l'environnement Big Data du BRGM.

Profil recherché

Compétences et qualités requises
- Solides bases en mathématiques : algèbre, statistiques descriptives et/ou inférentielles, probabilités
- Solides bases en informatique : pratique d'un langage de programmation Python ou R ; connaissance du SQL et notions en bases de données
- Capacité à travailler en équipe pluridisciplinaire (informaticiens, sismologues?)
- Capacité à présenter son travail à l'écrit et l'oral
Compétences et qualités appréciées
- Bases en data science : features engineering, algorithmes de machine learning (random forest, deep learning?)
- Bases en sismologie : Intensité macrosismique, PGA, Intensité d'Arias,
- Ville : Orléans

Offres d'emploi similaires

Se former

Créer mon compte candidat

Postuler

Je postule en un clic

Consultant RH

Je suis suivi·e par un consultant RH

Partage

Je reçois des offres exclusives

Confidentialité

Ma confidentialité est assurée

Actualités RH

 
 
Nos marques :