{"id":21316,"date":"2025-07-09T15:40:14","date_gmt":"2025-07-09T13:40:14","guid":{"rendered":"https:\/\/fondation-grenoble-inp.fr\/?post_type=projet&p=21316"},"modified":"2025-07-09T16:24:28","modified_gmt":"2025-07-09T14:24:28","slug":"these-creation-et-evaluation-de-grands-modeles-de-langue-decodeurs-pour-des-taches-de-redaction","status":"publish","type":"projet","link":"https:\/\/fondation-grenoble-inp.fr\/en\/projet\/these-creation-et-evaluation-de-grands-modeles-de-langue-decodeurs-pour-des-taches-de-redaction\/","title":{"rendered":"Th\u00e8se : Cr\u00e9ation et \u00e9valuation de grands mod\u00e8les de langue d\u00e9codeurs pour des t\u00e2ches de r\u00e9daction"},"content":{"rendered":"
Project leaders :<\/strong><\/p>\n\n\n\n Didier SCHWAB (Titulaire de la Chaire AugmentIA ; directeur de th\u00e8se) Project research areas :<\/strong> IA g\u00e9n\u00e9rative, traitement automatique du langage (TAL), mod\u00e8les de langue d\u00e9codeurs, g\u00e9n\u00e9ration de texte appliqu\u00e9e aux t\u00e2ches de r\u00e9daction, transfert d\u2019apprentissage (domaines, t\u00e2ches, langues), apprentissage continu, repr\u00e9sentation s\u00e9mantique, repr\u00e9sentation computationnelle<\/p>\n\n\n\n Organisations associated with the project :<\/strong> Fondation Grenoble INP, LIG, ARTELIA, MIAI Cluster<\/p>\n\n\n\n Description :<\/strong><\/p>\n\n\n\n Ce travail de th\u00e8se porte sur la cr\u00e9ation et l\u2019\u00e9valuation de grands mod\u00e8les de langue d\u00e9codeurs multilingues centr\u00e9s sur la g\u00e9n\u00e9ration automatique de textes, et plus particuli\u00e8rement sur les t\u00e2ches de r\u00e9daction int\u00e9gr\u00e9es aux processus m\u00e9tiers des ing\u00e9nieurs et de managers. Ces t\u00e2ches incluent la production de contenus techniques, pr\u00e9cis et adapt\u00e9s au contexte, tels que l\u2019\u00e9laboration de dossiers techniques et la synth\u00e8se documentaire (r\u00e9daction de rapports techniques, suivi de projets, assistance \u00e0 la conception, r\u00e9\u00e9criture, etc.). Axes<\/strong> de recherche :<\/strong><\/p>\n\n\n\n Questions de recherche (QR) : Expected results :<\/strong> Mod\u00e8les de langue d\u00e9codeurs sp\u00e9cialis\u00e9s, corpus (entra\u00eenement, \u00e9valuation) sp\u00e9cialis\u00e9s<\/p>\n\n\n\n
Philippe MULHEM (Directeur de th\u00e8se)
Diandra FABRE (post-doctorante)
Markarit VARTAMPETIAN (doctorante)<\/p>\n\n\n\n
Ainsi, la th\u00e8se s\u2019int\u00e9resse \u00e0 la cr\u00e9ation de mod\u00e8les de langue g\u00e9n\u00e9ratifs sp\u00e9cialis\u00e9s et multilingues ainsi que leur apprentissage continu, le transfert de connaissances entre domaines ou langues ainsi que la repr\u00e9sentation s\u00e9mantique ou les limites de captation du sens. Elle \u00e9tudie par ailleurs l\u2019interpr\u00e9tabilit\u00e9 et la transparence de r\u00e9ponses g\u00e9n\u00e9r\u00e9es par ces mod\u00e8les ainsi que leur repr\u00e9sentation computationnelle, notamment la r\u00e9duction de taille de mod\u00e8les en pr\u00e9servant leurs performances. Ces travaux s\u2019accompagnent \u00e9galement d\u2019enjeux transversaux tels que la r\u00e9duction des hallucinations de l\u2019IA, le respect des contraintes \u00e9thiques et l\u2019empreinte environnementale de ces syst\u00e8mes. Chaque point est analys\u00e9 en cr\u00e9ant des mod\u00e8les variant selon les donn\u00e9es (genre, taille) et les architectures, avec une comparaison incluant des mod\u00e8les priv\u00e9s non reproductibles. L\u2019ensemble des travaux s\u2019inscrit dans une d\u00e9marche de reproductibilit\u00e9 et de partage (documentation, code, mod\u00e8les, corpus ouverts -lorsque possible).<\/p>\n\n\n\n
– Interpr\u00e9tabilit\u00e9 et explication des r\u00e9ponses : Comment rendre les processus de r\u00e9cup\u00e9ration documentaire et de g\u00e9n\u00e9ration transparents pour les utilisateurs, afin qu’ils puissent comprendre d’o\u00f9 proviennent les informations et comment la r\u00e9ponse a \u00e9t\u00e9 construite ?
– Transfert d\u2019apprentissage : Comment transf\u00e9rer des connaissances d\u2019un domaine \u00e0 un autre, d\u2019une t\u00e2che \u00e0 une autre ?
Enjeux : partage de connaissances entre domaines et langues, transfert parcimonieux.<\/em>
– Apprentissage continu : Comment permettre aux mod\u00e8les d’apprendre de nouvelles informations et de s’adapter aux changements dans les connaissances sans n\u00e9cessiter un r\u00e9entrainement complet du mod\u00e8le ?
– Repr\u00e9sentation s\u00e9mantique : Qu’est-ce qui caract\u00e9rise les aspects du sens que les r\u00e9seaux profonds sont capables de capturer et ceux qu’ils sont incapables de capturer, et pourquoi ?
– Repr\u00e9sentation computationnelle : \u00c0 quel point peut-on r\u00e9duire la taille des repr\u00e9sentations sans (trop) de perte de connaissances ? Enjeux : r\u00e9duction de la taille des mod\u00e8les pour des raisons environnementales et pratiques.<\/p>\n\n\n\n