L'offre "STAGIAIRE EN DATA SCIENCE" a été sauvegardée.

Continuer

Prêt à postuler ?

Merci de confirmer votre adresse email pour commencer à postuler.

Complétez votre application

Connectez-vous

mot de passe oublié ?
ou

Vous n'avez pas de compte ?

STAGIAIRE EN DATA SCIENCE

CDI - temps plein
Neuilly-sur-Seine
N/A
34 Candidatures

Description de l'offre

Mission : dans le cadre du Programme Connaissance Client : Ce projet a pour objectif de tester et élaborer une méthode de réduction de dimension d’un problème complexe basé sur des données structurées.

Contexte : au sein de BEEZEN, en relation étroite avec ses clients, sous la Responsabilité croisée du Directeur de l’Innovation, l’ingénieur stagiaire intégrera une équipe projet de R&D afin de développer une solution innovante. La démarche consistera à produire :

1.         Un rapport de recherche

2.         Un rapport de stage (s’appuyant sur le rapport de recherche)

3.         La conception et les développements inhérents au sujet.

 

 

Activité : à partir d’un jeu de données structure présentant un grand nombre de colonnes :

•          Retenir un petit ensemble de méthodes de réduction de dimension s'avérant les plus pertinentes

•          Compléter les modélisations prédictives par une analyse explicative des phénomènes étudiés

•          Améliorer les capacités prédictives des modèles

•          Obtenir une méthode la plus généraliste possible permettant d’intégrer les données les plus diversifiées possibles en entrée

 

Il existe de très nombreuses méthodes pour réduire la dimension d'un : ACP, ACI, MDI, MD, LDA, MDD

Le recensement exhaustif de ces méthodes est un préalable à la sélection d'une méthode ayant les caractéristiques suivantes :

 

•          le moins de biais possible dans la sélection (exemple de biais : une variable comportant plus de modalités qu'une autre est privilégiée alors que son pouvoir explicatif n'est pas plus élevé)

•          la plus généraliste possible : cette méthode exige le moins de transformation possible des variables en amont et permet de traiter tous types de variables (catégorielles et numériques) quelques soient leurs distributions

•          la plus économique en temps de calcul (capable d'absorber de fortes volumétries)

On proposera, en fonction de cette base de connaissances, des améliorations des meilleures méthodes donnant lieu à des développements spécifiques dans différents langages.

On traitera deux ensembles de méthodes distincts :

1 - on ne considère que les méthodes ne retenant qu'un sous ensemble des variables de départ sans transformation

2 - on génère des nouvelles variables combinaisons des variables de départ

On n'oubliera pas que ces méthodes doivent tenir compte de l'aspect supervisé du problème.

 

Méthode de travail

Chacune des méthodes sera testée et les biais afférents analysés à partir de jeux de données standards et de jeux de données fournis par Beezen. Des informations externes (climatiques, INSEE, ...) pourront être intégrées pour tester des hypothèses explicatives de travail originales.

Conditions requises

Compétences requises

  • Ouverture d’esprit et capacité à explorer des sujets novateurs
  • Capacités d’analyse et de synthèse
  • Compétences rédactionnelles
  • Compétences techniques : connaissance des principes et algorithmes de machine learning – analyse multivariée

 

Confidentialité

  • Rapport de stage : tous les documents seront rendus à BEEZEN à l’issue du stage
  • Soutenance : La soutenance se déroulera à huis clos.
  • Durée : 6 mois

Numéro de référence

n/a

Offres similaires

Consultant Data Scientist – H/F Levallois-Perret Micropole
Data Scientist H/F Viroflay Expertime
Analyste Business Intelligence H/F Levallois-Perret ALLIANCE AUTOMOTIVE GROUP
CONSULTANT(E) DATA ANALYST/ DATA SCIENTIST Neuilly-sur-Seine INFOTEL
STAGE CONSULTANT BI – H/F Levallois-Perret Micropole

Recevoir des offres similaires

Merci. Vous allez recevoir des offres à l'adresse email
En cliquant ici, vous recevrez quotidiennement des offres similaires (Machine learning - Neuilly-sur-seine).