SmartWebScraper-CV
Introduction
Contexte Général
Problématiques du Scrapping Traditionnel
Solutions Apportées par l’Approche Visuelle
Avantages de Cette Approche
Contexte Académique
Objectifs du Projet
Objectifs Techniques Détaillés
Objectifs Fonctionnels
Workflow Complet
Objectifs d’Innovation
Métriques de Succès
Acquisition des Données
Constitution et Acquisition des Données
Stratégie d’Acquisition
Début de Constitution du Dataset
Résultats de la Collecte
Types de Contenu Priorisés
Méthode de Nettoyage
Traçabilité et Métadonnées
Défis Techniques Rencontrés
Validation de la Qualité
Préparation pour l’Annotation
Annotation et Dataset
Annotation et Structuration du Dataset
Objectif de l’Annotation
Évolution des Classes d’Annotation
Justification de l’Extension
Défis de l’Annotation Multi-Classes
Format d’Annotation COCO
Processus d’Annotation
Métriques de Qualité d’Annotation
Modélisation
Détection d’Objets : Modélisation et Fine-Tuning
Choix du Modèle de Détection
Architecture Technique Détaillée
Entraînement Initial
Environnement d’Entraînement
Métriques d’Évaluation
Analyse des Performances
Intégration dans l’Application
Optimisations Appliquées
OCR et NLP
Traitement NLP des Textes Extraits
Architecture du Système NLP
Principe de Préservation à 100%
Étapes de Traitement
Fonctionnalités de Traitement
Système Question-Réponse Local
Optimisations Performance
Métriques de Performance
API et Références
Guide d’Installation
Prérequis Système
Installation Complète
Installation des Services Externes
Configuration et Tests
Lancement de l’Application
Configuration Docker (Optionnel)
Dépannage
SmartWebScraper-CV
Index
Index