L’essor des modèles de langage de grande taille (LLMs) tels que GPT a révolutionné le domaine de l’intelligence artificielle, ouvrant de nouvelles avenues pour l’innovation dans le traitement automatique du langage naturel (NLP). Ces technologies avancées, qui permettent une compréhension et une génération de texte remarquablement efficaces, offrent des perspectives fascinantes pour des applications allant de la création de contenu automatisée à l’interaction conversationnelle intelligente. Ce stage offre l’opportunité de plonger au cœur de cette révolution technologique, en explorant et en contribuant au développement de solutions NLP à la pointe de la technologie.
Expertises:
Science des données ⊕
Domaine: Secteur numérique ⊕
Thème d'innovation: Les Intelligences Artificielles ⊕
Travail à réaliser
L’objet principal du stage consiste à mettre au point un moteur (code Python) permettant de vérifier si un écrit issu d’un domaine métier est conforme aux normes du domaine (exemple : description d’une fiche d’un matériau par rapport aux normes du domaine de la construction). L’aspect principal porte sur la recherche d’incompatibilités entre les deux. Selon l’avancée du stage, l’aspect complétude de l’écrit pourra aussi faire partie du travail. Le/la stagiaire utilisera notamment un LLM (large langage model) pour réaliser le moteur.
Profil du stagiaire
Etudiant/étudiante en Master/Ingénieur dans une filière liée à la sciences des données de préférence en dernière année.
Prérequis
Maîtrise de Python, analyse de données tabulaires, algèbre matricielle
Notions en deep learning souhaitées
Notions en NLP bienvenues mais pas indispensables (possibilité de se former durant le stage)
Durée
12 à 15 semaines minimum
Nous offrons
Une expérience enrichissante dans un centre de recherche de pointe.
Flexibilité dans l’organisation du travail, avec des possibilités de télétravail.
Encadrement par des professionnels expérimentés.
Responsable de stage
Christian Colot (christian.colot@cetic.be)