Job Details REF: RMM.R&D08.232-SCE

Apply now

Data Scientist F/H (identification d’appareils connectés sur un réseau) - Stage

SAGEMCOM - RECHERCHE ET DÉVELOPPEMENT | France - Rueil Malmaison | REF: RMM.R&D08.232-SCE

About Sagemcom

Sagemcom est un groupe européen de premier plan sur le marché des terminaux communicants à forte valeur ajoutée (solutions haut débit, solutions audio-vidéo et solutions de bout en bout de réseau intelligent) basé en France.
Le chiffre d'affaires total du groupe s'élève à 2,1 milliards d'euros. L'effectif de 5 500 personnes est réparti dans plus de 50 pays. Sagemcom est rentable depuis sa création en 2008 et 31% de ses employés sont actionnaires. Sagemcom conçoit, fabrique et expédie plus de 40 millions de terminaux dans le monde chaque année.

" Intégrer le groupe Sagemcom, c'est rejoindre un groupe de dimension internationale, où nous devons chaque jour relever de nouveaux défis pour rester leaders sur nos marchés. Si le travail en équipe, l'agilité, la créativité et les nouvelles technologies vous intéressent, rejoignez l'aventure ! "

Job description

Le stage s'inscrit dans le cadre des activités R&D de l'équipe solutions cloud, dont l'objectif est de développer des solutions innovantes de supervision et de gestion à distance d'équipements domestiques et de services connectés (ex. accès Internet, connectivité Wi-Fi, qualité VoIP et TV, etc.).

Ces solutions reposent sur des plateformes cloud centralisées de collecte, d'ingestion et de traitement des données d'usage afin d'optimiser les performances et la qualité des services domestiques.
Dans ce contexte, une identification précise des équipements connectés au sein d'un foyer est nécessaire afin d'offrir une qualité de service personnalisée.
Aujourd'hui, des algorithmes sont capables d'identifier certains équipements à partir des données reçues sur la plateforme. Par exemple, l'analyse des adresses MAC de ces équipements peut permettre une identification partielle du type d'appareil. D'autres techniques d'identification comme le DHCP fingerprinting peut également permettre l'identification de la nature des appareils connectés sur le réseau (smartphone, ordinateur, tablettes, imprimantes etc…), avec un certain niveau de confiance.

Dans le cadre du développement de la plateforme, l'intégration d'un système d'identification efficace et précis des équipements permettra d'enrichir et de consolider les services que propose la plateforme Big Data.
Cette fonctionnalité repose sur l'extraction, l'analyse et le déploiement d'un algorithme de Data Science à partir des données extraites sur notre plateforme Big Data.
Ces données proviennent principalement des informations prélevées par les différents équipements domestiques (box Wifi, répéteur Wi-Fi) au sein d'un foyer.

L'objectif de ce stage de concevoir, développer, et valider des algorithmes de Data Science basés sur les données présentes dans le Data Lake de nos produits afin d'identifier les différents appareils connectés sur les réseaux domestiques.
En particulier, ce stage consistera à :
-Étudier l'état de l'art général sur les différentes techniques d'identification des équipements (ex. DHCP fingerprinting, patterns des addresses MAC ou des hostnames, Machine Learning etc.) ;
- Identifier les différentes données nécessaires à collecter afin de permettre une identification précise des équipements connectés au sein d'un foyer (i.e., fournisseur, type, OS, modèle etc.) ;
Analyser l'architecture de la plateforme propriétaire de supervision et de diagnostic à distance d'équipement domestiques ;
- Étudier et proposer différents algorithmes permettant d'identifier la nature d'un équipement connecté à partir des données collectées par la plateforme ;
- Implémenter une preuve de concept dans l'environnement Big Data, tester la performance des algorithmes proposés et valider le fonctionnement de bout-en-bout de la solution proposée ;
- Rédiger des rapports techniques et présentations aux différentes équipes ;
- Réaliser des démonstrations

Job requirements

- Vous êtes en dernière année d'école d'Ingénieur avec une spécialité en Informatique, Big Data ou Data Science
- Vous êtes passionné(e) par les nouvelles (ex. Cloud, Big Data, IoT, Data Science, etc.)
- Vous avez des connaissances en langage Python pour l'écriture de script de Data Science
- Vous avez une première expérience dans un framework de Data Science tel que Pandas, Tensorflow, PyTorch, Keras, etc.
- Vous avez déjà étudié l'environnement Big Data (HDFS, Spark, Docker, Data Visualisation)
- Une bonne maîtrise des algorithmes de Data Science et de manipulation de données en Machine Learning et Deep Learning peuvent être un plus ;
- Des connaissances sur l'environnement embarqué est également un plus (Linux, C, C++)
- Vous connaissez les principaux formats de données (JSON, XML etc.) ;
- Vous êtes une personne curieuse, autonome et savez être force de proposition
- Vous parlez l'anglais de manière courante (lu et écrit)

Sagemcom est une entreprise handi-accueillante.

Apply to this job

Back to the search result




The data provided by the candidate is used by Sagemcom for recruitment process.

By clicking here , I agree that my data will be kept by Sagemcom for a period of 2 years for the purpose of processing my application, in accordance with its policy of managing personal data


(*) Mandatory Fields
( **) File accepted : PDF and Word / Max weight 5 Mo

In accordance with data protection and freedom of information laws, we inform you that you have the right to access, rectify and delete information concerning you by postal mail Sagemcom 250 route de l'Empereur 92500 Rueil Malmaison