L'offre Internship: Root Cause Analysis in complex distributed systems (H/F) a été sauvegardée.

Continuer

Offre sauvegardée

Entrez votre adresse e-mail pour enregistrer ce travail

Vous enregistrez ce travail sous:

FR
retour à la liste

Internship: Root Cause Analysis in complex distributed systems (H/F) posté par Nokia

CDI - temps plein
Nozay

Description de l'offre

About Nokia
Nokia is a global leader in creating the technologies at the heart of our connected world. Powered by the research and innovation of Nokia Bell Labs, we serve communications service providers, governments, large enterprises and consumers, with the industry’s most complete, end-to-end portfolio of products, services and licensing.
>From the enabling infrastructure for 5G and the Internet of Things, to emerging applications in virtual reality and digital health, we are shaping the future of technology to transform the human experience. www.nokia.com

Bell Labs, le centre de recherche et d’innovation de Nokia, est une organisation mondiale répartie entre plusieurs continents, avec des sites aux Etats-Unis, en Europe et en Asie. Le laboratoire s’appuie sur les traditions riches de la recherche des Bell Labs, incluant l’invention du transistor, du laser, de la théorie moderne d’information, du système d‘exploitation UNIX et des langages de programmation C/C++, afin de créer des technologies et des solutions de recherche innovantes pour les réseaux, la télécommunication, et les systèmes informatiques. Bell Labs est à la recherche d’un étudiant enthousiaste pour rejoindre ses efforts de recherche sur l’Analyse de Cause Racine dans les infrastructures de Cloud multi-tenants.
L’Analyse de Cause Racine (Root Cause Analysis - RCA) est une méthode de résolution de problèmes qui identifie et corrige les racines des pannes en opposition au simple traitement de leurs symptômes. Une compréhension tardive des racines des pannes impacte négativement la satisfaction des usagers du système. Nous nous intéressons plus spécifiquement aux infrastructures de Cloud qui mettent à la disposition de leurs usagers des ressources de calcul virtualisées. Dans ce contexte, les pannes correspondent soit aux problèmes de rupture de service dues aux défaillances de composants, soit aux problèmes de dégradations de performance dues à l’insuffisance des ressources ou à la présence des logiciels malveillants.
Dans le contexte de l'infrastructure de Cloud, le processus de RCA s'appuie sur un ensemble de modules. Tout d'abord, le monitorage des ressources de calcul et de communication est nécessaire à plusieurs niveaux de l'infrastructure: le niveau de l'application, le niveau des ressources virtuelles et le niveau des ressources physiques. Ensuite, les anomalies sont détectées et les alarmes sont déclenchées sur des ressources individuelles par le biais de l'analyse des mesures récoltées. Le flux d'alarmes est ensuite traité par le module de diagnostique de pannes et d’identification des scénarios de fautes. Les scenarios de fautes sont transmis au module de recouvrement des fautes pour suggérer des actions correctives à l’opérateur du Cloud. Les différents modules de RCA sont visualisés à l'aide d'un outil graphique.
Sous la responsabilité du tuteur, vos missions seront :
L'objectif de ce stage est de contribuer à la conception et au développement d’un système RCA distribué et scalable au sein d’une infrastructure Cloud expérimentale basée sur OpenStack. Le stage se focalisera sur l’analyse des causalités entre des séries de métriques observées (utilisation CPU, mémoire, bande-passante, etc.) ainsi qu’entre les alarmes identifiées et corrélées. Un autre objectif est de construire les chemins possibles permettant de relier les alarmes générées en utilisant les relations de causalité identifiées, et d’obtenir ainsi les scenarios de fautes possibles sous-jacents. Le candidat explorera les techniques de causalités et de raisonnement (ex. réseaux bayésiens) afin de mener sa mission. L’approche sélectionnée sera implémentée sur une plateforme SPARK.
Les compétences à acquérir ou à développer lors du stage ou de la période en milieu professionnel:
Le stagiaire bénéficiera d’une grande autonomie concernant l’évaluation et l’interprétation des résultats ainsi que pour la mise au point des algorithmes. Un travail performant pourrait aboutir à des publications scientifiques. Navettes gratuites au départ du Pont de Sèvres, Porte d’Orléans, Argenteuil, Chaville, Fontenay-le-Fleury.  Etudiant en dernière année de Master (Bac+5)Des connaissances solides dans l’un ou plusieurs des domaines suivants sont nécessaires :
  • Cloud Computing, OpenStack, Docker, Sysèmes,
  • Machine learning, réseaux bayésiens, Big Data analytics,
  • Plateformes Analytics, Spark et Spark streaming, Hadoop/MapReduce.
Lieu : Le stage se déroulera au centre de recherche Bell Labs de Nokia(91620 Nozay, Paris IDF, France).
Durée : 6 mois

Numéro de référence

1800000S94

Offres similaires

Recevoir des offres similaires

Merci. Vous allez recevoir des offres à l'adresse email