L'offre Stage - Ingénierie Linguistique : détection de similarité sémantique - H/F a été sauvegardée.

Continuer

Offre sauvegardée

Entrez votre adresse e-mail pour enregistrer ce travail

Vous enregistrez ce travail sous:

FR
retour à la liste

Stage - Ingénierie Linguistique : détection de similarité sémantique - H/F posté par EDF France

Stage
Palaiseau

Description de l'offre

Description de l'offre

Sujet : Etude sur les méthodes statistiques et linguistiques de détection de similarité sémantique.

Contexte  : La R&D d'EDF (2000 chercheurs) a pour missions principales de contribuer à l'amélioration de la performance des unités opérationnelles du groupe EDF, d'identifier et de préparer les relais de croissance à moyen et long termes. Dans ce cadre, le département Innovation Commerciale Analyse des Marchés et de leur Environnement (ICAME) est un département pluridisciplinaire (sciences de l'ingénieur, sciences humaines et sociales) qui fournit un appui à l'élaboration et au portage des offres, des services et des outils de relation Client aux Directions opérationnelles du groupe EDF. Au sein de ce département, le stage sera rattaché au groupe 'Statistiques et Outils d'Aide à la Décision ' (SOAD) qui compte une vingtaine d'ingénieurs chercheurs spécialisés en data mining, informatique décisionnelle et data science ayant pour mission de construire et mettre en oeuvre les méthodes d'analyse, de fouille et d'enrichissement de données volumineuses d'origines multiples, structurées ou complexes.

Le volume des données numériques textuelles disponibles augmente chaque année à un rythme exponentiel et l'analyse de ces informations, structurées ou non, est aujourd'hui un impératif stratégique pour une entreprise telle qu'EDF. Dans ce cadre, et dans l'objectif de toujours mieux connaître les besoins de ses clients, l'exploitation de ces documents implique l'utilisation de méthodes et d'outils adaptés. Dans le cadre des réflexions associées à la transition numérique du groupe EDF, il s'agit d'instruire comment l'intégration d'outils ' intelligents ' du Traitement Automatique de la Langue Naturelle écrite pourrait faciliter la recherche d'information dans les données textuelles.

Objectifs de la mission

La mission consistera à réaliser un état de l'état des outils et méthodes existants pour calculer une similarité sémantique à l'échelle phrase ou document et à tester ceux qui semblent les plus pertinents pour faciliter la consultation des données texte.

Plus précisément, il s'agira de:

  • Réaliser un état de l'art des outils et méthodes pour du calcul de similarité.
  • Mettre en place et appliquer des prétraitements adaptés selon la qualité des données.
  • Réaliser des tests sur différents types de données.
  • Etudier la faisabilité d'implémenter la méthode retenue au sein d'un moteur de recherche (Elastic Search, Ambar, autres).

Il sera notamment attendu :

  • Un transfert et dépôt des codes à l'équipe (git)
  • Une restitution des travaux réalisés.
  • Une documentation technique si nécessaire.



Profil souhaité

  • Master en Linguistique Informatique ou Traitement Automatique des Langues ou école d'ingénieur.
  • Connaissances des problématiques et technologies du text mining (recherche d'information, clustering, détection de similarité sémantique à différentes échelles).
  • Connaissance du langage python.
  • Connaissance d'outils de TALN (exploitation lexicales, syntaxiques, sémantiques ou autre).
  • Notions en ontologie et web sémantique.
  • Travail en équipe, aisance relationnelle.
  • Aisance rédactionnelle.

Informations pratiques

Unité d'accueil :

Groupe SOAD (Statistique et Outils d'Aide à la Décision), département ICAME d'EDF Lab Paris-Saclay,

7 boulevard Gaspard Monge, 91120 Palaiseau.

Le stage sera encadré par un ingénieur-chercheur du département ICAME.

Début du stage souhaité : le plus tôt possible en 2019.

Durée : 6 mois.





Numéro de référence

9d151081d37babf7b8c578a8bdbda717

Offres similaires

Recevoir des offres similaires

Merci. Vous allez recevoir des offres à l'adresse email