Omeka-plugin-UniversalViewer icon indicating copy to clipboard operation
Omeka-plugin-UniversalViewer copied to clipboard

Recherche avec UV

Open JBPressac opened this issue 7 years ago • 8 comments

Bonjour, Comment implémenter la recherche dans un document avec UV ? Autrement dit, sous quelle forme doit-être le texte dans lequel UV va faire des recherches ? Merci,

JBPressac avatar May 14 '18 11:05 JBPressac

Bonjour,

Uv permet effectivement de faire des recherche sur les textes transcrits, mais le module n'implémente pas cette fonction, car il n'y a pas de champs standard (dcterms ou autre) pour le texte. Il faut donc modifier le manifeste (via un autre plugin qui utilise le filtre "uv_manifest", ou via un manifeste externe) pour intégrer le texte conformément aux spécifications iiif : http://iiif.io/api/presentation/2.1/#advanced-association-features. Il est possible également de modifier la configuration d'uv pour afficher le champ de recherche.

Daniel-KM avatar May 15 '18 08:05 Daniel-KM

Merci pour votre réponse. Existe-t-il déjà des plugins qui modifieraient le manifeste pour y intégrer le texte ? Connaitriez-vous des logiciels ou des librairies qui permettraient de convertir des fichiers ALTO ou TEI, par exemple, en annotations IIIF ? Merci,

JBPressac avatar May 15 '18 08:05 JBPressac

A ma connaissance, pour la recherche plein-texte au sein d'un document (c'est-à-dire, au sens de IIIF, dans les annotations textuelles associées au Manifest) UV interagit avec un webservice qui doit être conforme à l'API Search de IIIF : http://iiif.io/api/search/1.0/ (comme dans cet exemple : https://d.lib.ncsu.edu/collections/catalog/nubian-message-1992-11-30). Il faudrait donc un plugin Omeka capable de générer ce service à partir de données textuelles (transcriptions en TEI, ou fichiers ALTO pour de l'OCR par ex.), et lier ce service au Manifest chargé par UV (en utilisant la propriété service de l'API Presentation : http://iiif.io/api/presentation/2.1/#service).

Pour info La Bodleian Library met à disposition des outils de conversion de fichiers METS et TEI vers IIIF (à tester...) : https://github.com/bodleian/dmt-metadata-transformation#conversion-of-tei-files.

regisrob avatar May 15 '18 12:05 regisrob

Merci pour votre réponse @regisrob. Dommage que ces technos soient si compliquées à implémenter et qu'il soit nécessaire de passer d'un format de données à une autre. Espérons que le jeu en vaille la chandelle...

JBPressac avatar May 15 '18 12:05 JBPressac

Pas forcément évident à implémenter en effet, mais le fait de passer par un format commun sur lequel vont pouvoir s'appuyer tous les clients compatibles avec cette spec (Mirador, UV etc.) est indispensable à leur interopérabilité dans l'environnement IIIF. Sinon chaque client devrait être capable d'interpréter tous les formats potentiels de transcription ou d'océrisation existants, selon les domaines, selon les applications (ALTO, hOCR, PAGE, ABBYY XML, TEI et ses différentes "flavours" etc.).

regisrob avatar May 15 '18 13:05 regisrob

Effectivement, le format iiif est en train de l'emporter sur les nouveaux outils (avec le format w3c annotation).

Comme la version Omeka S du plugin est très similaire, si le travail est fait sur cette version, cela sera une évolution durable. Sinon c'est sans doute une question de budget.

Daniel-KM avatar May 16 '18 07:05 Daniel-KM

Merci pour vos réponses. Je note le lien avec le standard du W3C Web Annotations. Un des exemples d'utilisation de Web Annotations est le codage de commentaires et je trouve à priori curieux de considérer la transcription comme une forme de commentaire ou d'annotation, mais pourquoi pas. On trouve d'ailleurs dans un cas d'utilisation concernant la transcription du scan d'un manuscrit dans Embedding Web Annotations in HTML par le groupe de travail du standard.

JBPressac avatar May 16 '18 19:05 JBPressac

Any progess here? You could use bibo:transcriptOf to store OCR or transcript. Would this be a solution or work around? Which php-files do I hav to modifiy for that? Only \modules\IiifServer\src\View\Helper\iifManifest.php or other file, too? Thanks for help and sorry for switching to English.

m-art-in avatar Jul 11 '19 12:07 m-art-in