# Cahier des charges - PICC ++ ## Context PICC est un projet de bachelor réalisé l'année passée pour l'entreprise Exelop SA et leur plateforme PICC. Cette dernière permet de capitaliser de façon simple et collaborative les connaissances d'une entreprise. Ceci notamment dans le but de partager efficacement les solutions aux problèmes récurrents rencontrés dans un même domaine d'application. Mon collègue Guillaume Chacun qui a effectué ce travail de Bachelor est arrivé a des résultats très satisfaisants grâce à un pipeline de traitement des données efficace. Il a développé un processus de pré-traitement des données brutes et une intelligence artificielle capable de distinguer les solutions des problèmes. Seulement, un point faible de son travaille réside dans le traitement de phrases trop longues. Là où l'outil arrive à distinguer les problèmes, les solutions et les neutres parmis des données contenant des phrases de 9 mots en moyenne avec un taux de 80-90%, il peine beaucoup plus avec des phrases plus longues (~25 mots en moyenne) avec un taux de réussite de seulement ~50%. ## Problème Le but de ce travaille sera donc de créer un outil de pré-traitement de texte qui permettra de réduire la taille des phrases que l'on donne à PICC. Afin de visualiser la différence, une interface graphique sera réalisée. Elle permettra l'entrée facilitée de données et leur traitement par PICC en direct, avec et sans le prétraitement PICC ++. L'outil devra aussi permettre à l'utilisateur de choisir entre plusieurs méthodes de prétraitement afin de les évaluer. Il se peut que certaines méthodes soient plus efficaces dépendant du type de texte. Au total 3 méthodes différentes devront être implémentées dans l'idéal. Si d'autres idées sont testées et ont l'air prometeuses, elles pourront éventuellement être ajoutées. La langue supportée sera le français. ## Objectifs ### Principaux 1. Développement d'une méthode procédurale. 2. Développement d'une méthode utilisant le machine learning. ### Secondaires 1. Développement d'une troisième méthode. 2. Développement d'une interface graphique.