0

6 La navigation dans le manuel de Kentika est réservée aux utilisateurs identifiés



Acquisition de fichiers numérisés via Fine Reader

Note technique

06/09/2010

Reconnaissance optique de caractères

Niveau d'autorisation : Public

Acquisition de fichiers numérisés via Fine Reader

 

Fine Reader est un logiciel OCR (reconnaissance optique de caractères) qui permet de créer des fichiers numériques interrogeables et réutilisables à partir de documents numérisés, de PDF et/ou de photos numériques.

 

Avec cette application, vous pouvez réutiliser les données dans vos documents et images, et les transformer en informations accessibles.

 

Si vous avez opté pour le module "full text" le contenu des documents issus d'une numérisation devient alors cherchable.

 

Fine Reader est disponible en plusieurs versions. Ce qui est décrit ci-dessous correspond à la version Professionnelle. Pour une automatisation du traitement OCR après archivage au niveau du serveur (ie : sans intervention de la part de la personne effectuant la saisie), la version Corporate est requise.

 

Par rapport à la solution Pix2PDF, l'utilisation de Finereader implique une reconnaissance avant l'acquisition du fichier (vs en mode dfifféré avec Pix2PDF qui fonctionne en automate sur le serveur).

 

Réglages des paramétres dans Kentika

 

Après avoir téléchargé et installé l'application, il vous faut indiquer à Kentika comment l'utiliser. Créez un nouveau document et procédez comme indiqué ci-dessous (clic droit):

 

 

En cliquant sur le bouton d'ajout Script/application, vous allez pouvoir sélectionner votre application FineReader.exe.

 

 

Une fois cette opération réalisée, vous avez maintenant la possibilité dans les options Geide de choisir l'application Fine Reader pour le traitement de vos documents.

 

 

Acquérir un document via Fine Reader

 

Via un clic droit sur le bouton Geide, sélectionnez FineReader.exe.

 

 

Le logiciel se lance automatiquement et vous pouvez ainsi numériser et convertir vos documents en pdf interrogeable ou modifiable, d'un poid inférieur à 200 Ko.

 

Fine Reader fonctionne avec tous les modèles de scanners, mais la fiabilité de la numérisation et de l'acquisition sont évidemment tributaires de la qualité de l'appareil de capture. En fonction du type de document que vous souhaitez numériser, il existe différentes gammes de scanners comme vous pouvez par exemple le voir ici.

 

Fine Reader

 

Pour valider votre acquisition, enregistrez votre document au format .pdf dans un dossier "NewScan" que vous aurez préalablement créé dans le répertoire Altemp de votre base.

 

Structure du Répertoire Altemp

 

 

Après validation, les fichiers sont transférés automatiquement dans le dossier "NEWTEMP".

Le document est joint à votre notice et vous pouvez consulter votre document dans la visionneuse.

 

Le document numérisé, ainsi transformé en pdf et intégré dans la base, vous pouvez entre autre sélectionner le texte et l'extraire par copier-coller.

Alternatives

 

Le module d'acquisition de fichiers/applications via Fine Reader est une solution pratique pour pallier aux problèmes d'intégration de fichiers contenant du texte.

 

Mais il existe des alternatives, tout aussi efficaces.

 

Vous pouvez notamment mettre un dossier (contenant vos fichiers à intégrer dans Kentika) en surveillance, via la centrale d'importation. Ainsi, chaque nouveau fichier déposé dans ce répertoire sera traité directement par Kentika, via un filtre d'import.

 

Si vous ne souhaitez pas utiliser la centrale d'importation, vous pouvez opter pour la méthode : IMP_Folder. Reposant sur le même principa que celui de la centrale d'importation (dossier mis en surveillance), l'alimentation s'effectue par déclenchement en mode batch ou via le menu Exploitation).