Generation_UDS_RSA/visualisation
2026-04-02 11:26:07 -04:00

49 lines
3.6 KiB
Plaintext
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

Premiere étape est de pouvoir lire les lignes du fichier PDF et d epouvor copier ces lignes la dans des cellules spécifique, je me demande si je peux faire
en sorte de rendre le programme plus flexible en étant capable de lire les cellule spécifiques avec des espace overts et pouvoir changer l'un a l'autre
comme ca je peux analyser le ficher avec les cellules ouverts et ensuite passer à l'autre cellule ouvert. aussi pour le pdf je pense qu'au lieu de faire ligne 1 à ligne 2 pour le lire
il faudrait que la lecture se fasse par le nom dans le fichier pdf par example ligne 1 sera écrit nom du poteau: PBD351 rue roy il faudrait que la lecture trigger ''au nom du poteau'' est qu ça correspond
à la cellule spécifique qui sera lut est écrit donc ''nom du poteau'' correspondera toujours à la même cellule peu importe. le création et l'écrite du fichier excel devrait être indépendant du fichier pdf qui appelera l
fichier excel.
Dans le fichier PDF il y aura deux forme de modèle RSA et UDS,deux fonction different qui sera appelé en lisant la premiere ligne qui sera le titre:RSA ou UDS. je ne sais pas si le programme se rémémore les ligne
mais sinon ils seront mit dans un tableau avant de tomber dans la fonction. dans la fonction le but se sera de ordonner les données pour l'écriture en order dans la cellule qui va créer l'excel. Le nom de l'excel
sera donnée par la valeur du nom du poteau. Les duex fonctions seront RSA ou excel en entrant avec le tableau. Je dois aussi spécifier le nombre de fichier pdf que je dois analyser ou le nombre de page, je ne sais
si il peut lire le nombre de page spécifiquement ou il y a moyen de créer un fichier par page avec le pdf.je dois rentrer le nombre de pdf à lire.
Dans le PY de l'excel, je vais devoir créer un excel qui est une copie de l'excel(toujours copier l'excel qui est vide) (je ne sais pas si je peux copier l'excel pour l'uds sans chier les macros), ensuite le gros truc est que je ne sais pas
si je peux repérer les cellules qui sont vides et ensuite détecter ca et pouvoir écrire et ensuite passer à la prochaine cellule vide si je peux faire ca donc ça devrait être facile. Je dois rentrer avec le nombre de fichier que je vuex faire.
-----------------------------------------
✅ Objectif global
Lire un ou plusieurs fichiers PDF, en extraire les données selon un format RSA ou UDS, détecter des mots-clés (comme "Nom du poteau"),
organiser les données dans un tableau structuré, et remplir un fichier Excel modèle dans les bonnes cellules. Tu veux :
Lire un PDF page par page (ou fichier par fichier).
Identifier automatiquement si cest un modèle RSA ou UDS.
Extraire des champs (ex : "Nom du poteau", "Adresse", etc.) avec leurs valeurs.
Copier les valeurs extraites dans un modèle Excel existant, en remplissant les cellules vides spécifiques.
Générer un nouveau fichier Excel par entrée, avec le nom basé sur la valeur du champ "Nom du poteau".
🧩 Étapes proposées
Étape 1 : Lecture du PDF
Utiliser PyMuPDF (alias fitz) ou pdfplumber pour lire le contenu texte ligne par ligne.
Détecter le type de modèle ("RSA" ou "UDS") sur la première ligne.
Récupérer les lignes avec des mots-clés connus : par ex. "Nom du poteau: PBD351 rue Roy".
Flexibilité et extensions possibles
✅ Tu peux détecter les cellules vides avec if ws[cellule].value is None:
✅ Tu peux adapter les correspondances avec un dictionnaire par type de modèle (RSA, UDS)
✅ Le code est indépendant du contenu PDF il extrait et transforme en dictionnaire générique
✅ Tu peux entrer le nombre de fichiers à traiter, ou le nombre de pages à lire