Ingénieur R&D en Traitement de Données et Nlp - Llm H/F - VeoNum Rennes - 35
- Bac +5
- Secteur informatique • ESN
- Exp. 1 à 7 ans
- Exp. + 7 ans
Rejoins une équipe R&D passionnée et innovante !
Au coeur d'une équipe de recherche innovante, tu participeras à des travaux de pointe en modélisation des données techniques et en intelligence artificielle, avec un focus sur le traitement du langage naturel (NLP). L'objectif est de développer des modèles basés sur des Large Language Models (LLM) pour formaliser des comportements complexes à partir de documents techniques tels que des standards, des datasheets, et des données terrains.
Ce projet stratégique nécessite la constitution de datasets de haute qualité, permettant l'entraînement de modèles NLP performants capables de répondre à des requêtes en mode « Question & Answer » ou d'extraire des informations clés.
Mission :
Tu seras responsable de la collecte, du traitement et de la structuration de données techniques en vue d'entraîner des modèles LLM. Tes principales missions incluront :
- Collection et organisation des documents : Développer un script Python pour collecter automatiquement des données techniques issues de standards, de datasheets, et d'autres sources pertinentes.
- Préparation et segmentation des données : Analyser les données collectées et les segmenter en « input » et « label » selon les besoins spécifiques des tâches NLP.
- Structuration et formatage des datasets : Organiser les données dans des formats compatibles avec les frameworks d'apprentissage machine, notamment sous forme de dictionnaires Python.
Au coeur d'une équipe de recherche innovante, tu participeras à des travaux de pointe en modélisation des données techniques et en intelligence artificielle, avec un focus sur le traitement du langage naturel (NLP). L'objectif est de développer des modèles basés sur des Large Language Models (LLM) pour formaliser des comportements complexes à partir de documents techniques tels que des standards, des datasheets, et des données terrains.
Ce projet stratégique nécessite la constitution de datasets de haute qualité, permettant l'entraînement de modèles NLP performants capables de répondre à des requêtes en mode « Question & Answer » ou d'extraire des informations clés.
Mission :
Tu seras responsable de la collecte, du traitement et de la structuration de données techniques en vue d'entraîner des modèles LLM. Tes principales missions incluront :
- Collection et organisation des documents : Développer un script Python pour collecter automatiquement des données techniques issues de standards, de datasheets, et d'autres sources pertinentes.
- Préparation et segmentation des données : Analyser les données collectées et les segmenter en « input » et « label » selon les besoins spécifiques des tâches NLP.
- Structuration et formatage des datasets : Organiser les données dans des formats compatibles avec les frameworks d'apprentissage machine, notamment sous forme de dictionnaires Python.
Recommandé pour vous
- > Logistique
- > Agroalimentaire
- > Tourisme
- > Secrétariat
- > Formation
- > Auvergne-Rhône-Alpes
- > Outre Mer
- > Environnement
- > Restauration
- > Occitanie
- > Agricole
- > Administratif
- > Transport
- > Architecture
- > Île-de-France
- > Qualité
- > Artisanat
- > Centre-Val de Loire
- > Achat
- > Telecom
- > Commerce
- > Gestion
- > Ressources Humaines
- > Bourgogne-Franche-Comté
- > Sécurité
- > BTP
- > Pays de la Loire
- > Audit
- > Service Public
- > Nouvelle-Aquitaine
- > Finance
- > Distribution
- > Audiovisuel
- > Vente
- > Santé
- > Hotellerie
- > Edition
- > Direction
- > Hauts-de-France
- > Assurance
- > Ferroviaire
- > Chimie
- > Production
- > SAV
- > Corse
- > Social
- > Nautisme
- > Marketing
- > Informatique
- > Juridique
- > Electronique
- > Aeronautique
- > Biotechnologie
- > Nettoyage
- > Pub
- > Hospitalier
- > Bretagne
- > Normandie
- > Culture
- > Banque
- > Enseignement
- > Industrie
- > Comptabilité
- > Immobilier
- > Défense
- > Grand Est
- > Ingénierie
- > Beauté
- > Provence-Alpes-Côte d'Azur
- > Communication
- > Automobile
- > Recherche
- > Graphisme
- > Service