Un projet inter UNT pour le développement de réseaux de portails communicants
Le logiciel ORI-OAI (Outil de référencement et d'indexation en réseaux de portails compatibles OAI-PMH), développé dans le cadre Inter-UNT est un système ouvert, en logiciel libre, permettant de :

Créer une archive institutionnelle des ressources numériques produites par l'établissement universitaire seul ou en réseau (UNT, UNR)

Valoriser ces ressources (pédagogiques, scientifiques, documentaires, administratives...) par une indexation de qualité,

Partager ces ressources avec d'autres établissements,

Ouvrir l'archive sur les réseaux tout en respectant les droits d'accès réservés.
Le développement ORI-OAI s'appuie sur les travaux de plusieurs groupes, consortiums et universités numériques.
La diffusion de la première version est en cours, après une période d'expérimentation qui s'est déroulée dans plusieurs établissements:

Les établissements expérimentant ORI-OAI ( en plus des développeurs Valenciennes, Rennes, INSA-Lyon, INP-Toulouse)

Les universités de Angers, Limoges, Toulouse 2, Perpignan, Nancy 2, Paris 11, Clermont

L'ENSG-IGN
Télécharger la plaquette de présentation - pdf, 426 koLes établissements intéressés par l'installation de cette version peuvent se faire connaître auprès des développeurs et notamment
Yohan Colmant
Historique du projet ORI-OAI
Lorsque le consortium UNIT s’est posé la question du développement d’une nouvelle version de son portail, il s’est très vite rendu compte qu’un portail unique, regroupant les contenus pédagogiques produits par les cinquante établissements membres poserait rapidement des problèmes de performances informatiques.
C’est pourquoi, UNIT a choisi de s’appuyer sur le protocole OAI-PMH afin de fonctionner dans une logique de réseau de portails OAI. Les partenaires UNIT sont chargés d’exposer les métadonnées résultant de l’indexation de leurs ressources pédagogiques et UNIT assure la moisson de tous les serveurs (portails OAI).
Cette question s’est posée, de la même manière, pour les autres UNT. UVED a rejoint très vite les réflexions d'UNIT et s’est impliqué dès le démarrage du projet. AUNEGE et UNISCIEL se sont ensuite joint en participant aux groupes de réflexion sur les portails communicants OAI. L’UMVF s’y intéresse maintenant.
La pluridisciplinarité, étant à l’honneur parmi ses partenaires, UNIT a bien perçu l’intérêt d’accéder à certains cours d’économie d’AUNEGE qui utiliserait volontiers les contenus mathématiques d’UNISCIEL.
Le moissonnage des ressources pédagogiques, concernera, dans le futur, toutes les UNT.
Ce constat a conduit la SDTICE à classer le projet OAI comme un projet transversal et à en assurer le financement direct.
L’INSA de Lyon, partenaire UNIT, qui travaille depuis plusieurs années au projet SYNAPSE de création d’une archive institutionnelle, rejoint le projet qui devient ORI-OAI en ajoutant le besoin d’un Outil de Référencement et d’Indexation pour tous types de ressources numériques pédagogiques, scientifiques ou administratives.
Les composants du projet
ORI-OAI est un projet transverse, inter-UNT, développé en collaboration par l’INPT, l’INSA de Lyon, les universités de Rennes 1 et de Valenciennes. Le logiciel produit est un logiciel libre, disponible pour tous, soumis à la licence GPL, basé sur une capitalisation des travaux menés par ESUP. Il est constitué de 7 briques logicielles indépendantes et interconnectables.
Le moteur de Workflow : ORI-OAI-workflow
Le moteur de Workflow gère le flux des données en local selon les procédures de travail définies par l’établissement. Il assure la coordination entre les différents acteurs : les auteurs, les documentalistes, etc. en permettant la répartition de la saisie des métadonnées d’un document. Différents formats de métadonnées peuvent être proposés, selon les documents gérés. L’éditeur de métadonnées a été développé avec l’aide de la société ORBEON. Les fiches créées sont stockées sur une base XML (eXist).
L’entrepôt OAI : ORI-OAI-repository
Il expose un ensemble de fiches de métadonnées à la moisson au travers du protocole OAI-PMH. Il répond aux requêtes émises par tout moissonneur OAI. L’entrepôt peut afficher les différents formats de métadonnées présents dans l’application (formats de métadonnées moissonnées ou produites)
Le Moissonneur : ORI-OAI-harvesting
Le rôle de ce module est de moissonner les fiches d’un ensemble paramétrable d'entrepôts OAI via le protocole OAI-PMH. De même que dans le module workflow, ce module stocke les fiches moissonnées sur une base XML (eXist).
L’Indexeur : ORI-OAI-indexing
Il indexe les fiches moissonnées et produites, en utilisant le logiciel libre Lucene/Lius (Lucene Index Update and Search).
Le Moteur de Recherche : ORI-OAI-search
Le moteur de recherche, interfacé avec l’utilisateur, interroge les index des fiches pour indiquer à l’utilisateur les documents locaux et distants répondant aux critères demandés.
Le module Vocabulaire : ORI-OAI-vocabulary
Ce composant sert à répertorier et à gérer les différents vocabulaires et classifications de l’application. Il peut être utilisé pour la saisie de mot-clefs contrôlés, de noms d’institutions, de classifications disciplinaires, etc. Certains vocabulaires peuvent être gérés de manière globale au niveau d’une UNT, de plusieurs UNT, nationalement, etc. Ils doivent alors être cohérents pour toutes les entités concernées. Tandis que d’autres vocabulaires peuvent être définis localement. Ce module est actuellement dans une version provisoire.
Le serveur WebDAV : ESUP-serveur-WebDAV
La gestion des contenus numériques (documents) est opérée par ce serveur. Il permet l’authentification SSO (single sign-on) et la fédération d’identités en utilisant Shibboleth.
Formats de métadonnées
ORI-OAI permet de gérer tous types de formats de métadonnées. Actuellement, le module de workflow propose un éditeur LOM et un éditeur Dublin Core. Pour les ressources pédagogiques, l’éditeur LOMfr sera proposé dès que le schéma XML LOMfr aura été finalisé dans le cadre des travaux de l’AFNOR. D’autres formats sont en cours d’intégration : TEF, CDM, AO.fr…
D’ores et déjà, tout format de métadonnées exposés (CDM,…) peut-être moissonné et exploité au travers du moteur de recherche.
Instances d’ORI-OAI en production pour UNIT
Le portail UNIT (www.unit.eu), est la première application opérationnelle du logiciel ORI-OAI. Il exploite les fonctions de moissonnage et d’interrogation.
Rappels sur l’initiative OAI-PMH (Open Archive Initiative – Protocol for Meta-data Harvesting)
Cette initiative tire ses origines de l’apparition des bibliothèques de documents numériques. La première a été le serveur hep-th (High Energy Physics – Theory), devenu arXiv, créé par la communauté des physiciens des hautes énergies en 1991, puis étendu aux mathématiques et à l’informatique.
Des bibliothèques équivalentes sont ensuite apparues dans le domaine de l’économie, de l’archivage des thèses, ... Chaque bibliothèque, conçue indépendamment des autres, était dotée d’une interface informatique différente. L’utilisateur intéressé par leur interrogation devait apprendre l’usage de chaque interface.
En juillet 1999, Paul Ginsparg, le créateur de arXiv, et quelques collègues (chercheurs et bibliothécaires) ont appelé à la tenue d’une conférence pour définir un format standard de dépôt pour les documents archivés par leur auteur. L’initiative OAI-PMH s’est mise en place à la suite de ces échanges.
Différentes solutions sont envisagées. Il apparaît rapidement que l’interrogation simultanée de nombreuses bibliothèques digitales, pour chaque requête, était pénalisante, le temps de réponse étant imposé par la plus lente. La seconde idée de collecter (« moissonner ») régulièrement les métadonnées (descriptions structurées des documents) de ces bibliothèques permettait de proposer une solution efficace.
C’est cette dernière solution qui a été choisie pour la mise en place du protocole OAI-PMH (Protocol for Meta-data Harvesting). Ce protocole a été conçu en s’appuyant sur le protocole de transport HTTP et sur le format XML pour l’échange d’information. Deux types de services ont été définis, les fournisseurs de contenus et les fournisseurs de services. Les premiers, en grand nombre et dispersés, archivent les contenus. Ils sont appelés entrepôts. Les seconds, en petit nombre, agrègent les informations sur les métadonnées des premiers et répondent aux requêtes des utilisateurs. Ils sont appelés moissonneurs. Ces deux services s’appuient sur un format commun de métadonnées et sur des procédures d’échange normalisées.
Dernière mise à jour : 04/10/2007