L'offre "STAGE - Ingénieur(e) Recherche - Leverage Data Patrimony" a été sauvegardée.

Continuer

Prêt à postuler ?

Merci de confirmer votre adresse email pour commencer à postuler.

Complétez votre application

Connectez-vous

mot de passe oublié ?
ou

Vous n'avez pas de compte ?

STAGE - Ingénieur(e) Recherche - Leverage Data Patrimony posté par Dassault Systemes

CDI - temps plein
France, Vélizy-Villacoublay Cedex
N/A

Description de l'offre

Contexte & Présentation d'équipe

Votre stage se déroulera dans l’équipe Data Science qui s’intéresse aux problématiques liées aux environnements de dimension massive, mixant le réel et le virtuel, et générant des quantités de données complexes nécessitant l’automatisation de leur traitement et de leur analyse afin d’en extraire une connaissance et des modèles à forte valeur ajoutée.

Grâce aux solutions de stockage de données « cloud », nous constatons une prolifération de contenus numériques hétérogènes. Afin de naviguer dans ces contenus, il devient nécessaire de développer des technologies d’analyse automatique.  Les techniques basées sur l’apprentissage statistique (Deep Learning en particulier) sont très efficaces pour analyser des données complexes. Malheureusement, ces techniques nécessitent de grandes quantités de données annotées. Cette annotation est très coûteuse et nécessite beaucoup de travail manuel. De plus, plusieurs niveaux d’annotations sont nécessaires selon la complexité des données. Les annotateurs doivent avoir une grande expertise pluridisciplinaire.

L’annotation semi-supervisée est l’une des pistes privilégiées dans la recherche.  Cette technique se base sur la collecte manuelle d'annotations localisées et d’outils automatiques de propagation de ces annotations vers les données non labélisées.  De plus, la collecte d’annotations localisées nécessite l’étude de techniques efficaces pour la visualisation de données massives.


Rôle & Objectif

Le but de ce stage est de développer un prototype d’environnement d’annotation de données intégrant la visualisation des données (basée sur des techniques de réduction de dimension telles que la PCA ou le t-SNE), la collecte d’annotations locales et des algorithmes de type apprentissage semi-supervisé inductif et transductif scalable (Anchor based) afin de propager les annotations manuelles à de grandes quantités de données. 
Dans un premier temps, vous devrez établir une recherche bibliographique sur le domaine et développer un prototype adapté aux données de Dassault Systèmes. Sous la supervision de votre tuteur, vous devrez déterminer les outils de propagation à intégrer dans le prototype et les implémenter. Enfin, la qualité des annotations sera évaluée sur des données synthétiques et réelles.


Etudiant(e) en Ecole d'Ingénieurs ou Master universitaire, vous préparez un diplôme de niveau Bac+5 ou un Mastère spécialisé. Vous vous spécialisez en Informatique, Apprentissage Statistique, Mathématiques Appliquées.

Stage obligatoire de validation de cursus, sous convention de stage.
Durée 6 mois maximum, à débuter dès Février 2018


Compétences techniques requises

• Pratique de la programmation Web et du Python
• Connaissances en C++ souhaitées
• Des bases en apprentissage statistique seront fortement appréciées
• Bonne maitrise de l’anglais à l’oral et à l’écrit pour la rédaction de documentation


Qualités professionnelles requises

• Curieux(se) et motivé(e)
• Rigoureux(se) et assidu(e) dans votre travail

Numéro de référence

312445

Recevoir des offres similaires

Merci. Vous allez recevoir des offres à l'adresse email
En cliquant ici, vous recevrez quotidiennement des offres similaires (Web - Paris).