SmartWebScraper-CV

Introduction

Contexte Général
Problématiques du Scrapping Traditionnel
Solutions Apportées par l’Approche Visuelle
Avantages de Cette Approche
Contexte Académique
Objectifs du Projet
Objectifs Techniques Détaillés
Objectifs Fonctionnels
Workflow Complet
Objectifs d’Innovation
Métriques de Succès

Acquisition des Données

Constitution et Acquisition des Données
Stratégie d’Acquisition
Début de Constitution du Dataset
Résultats de la Collecte
Types de Contenu Priorisés
Méthode de Nettoyage
Traçabilité et Métadonnées
Défis Techniques Rencontrés
Validation de la Qualité
Préparation pour l’Annotation

Annotation et Dataset

Annotation et Structuration du Dataset
Objectif de l’Annotation
Évolution des Classes d’Annotation
Justification de l’Extension
Défis de l’Annotation Multi-Classes
Format d’Annotation COCO
Processus d’Annotation
Métriques de Qualité d’Annotation

Modélisation

Détection d’Objets : Modélisation et Fine-Tuning
Choix du Modèle de Détection
Architecture Technique Détaillée
Entraînement Initial
Environnement d’Entraînement
Métriques d’Évaluation
Analyse des Performances
Intégration dans l’Application
Optimisations Appliquées

OCR et NLP

Traitement NLP des Textes Extraits
Architecture du Système NLP
Principe de Préservation à 100%
Étapes de Traitement
Fonctionnalités de Traitement
Système Question-Réponse Local
Optimisations Performance
Métriques de Performance

API et Références

Guide d’Installation
Prérequis Système
Installation Complète
Installation des Services Externes
Configuration et Tests
Lancement de l’Application
Configuration Docker (Optionnel)
Dépannage

SmartWebScraper-CV

Index

Index

© Droits d'auteur 2025, DJERI-ALASSANI OUBENOUPOU & EL MAJDI WALID.

Compilé avec Sphinx en utilisant un thème fourni par Read the Docs.