Facile à classifier
parce qu'il contient des métadonnées valables permettant la classification automatique sans analyse préalable et sans saisie manuelle. Ces documents se prêtent à l’indexation par les moteurs de recherche et à être intégrés dans des collections bibliothécaires qui utilisent ou non des containers indépendants pour les métadonnées.
Les bibliothèques universitaires et publiques très souvent gardent les métadonnés dans des catalogues ou bases de données en dehors des objets concernés pour des raisons d’intégrité et pour mieux les gérer. Puisque l’un n’exclut pas l’autre, il semble judicieux d’incorporer également ces mêmes données dans les documents eux-mêmes. Ceci les rend accessibles aux utilisateurs qui désirent sauvegarder les documents localement pour construire leur propre base de savoir et de les consulter hors ligne et détaché de tout catalogue. La notation par paires d’attributs/vocable(s) est normalement adéquate pour utilisation privée.
Publications scientifiques facile à classerLa facilité de classer, ou la lisibilité par machine, est de plus en plus important
en raison de l'influence mondiale de la numérisation et l'accès ouvert
dans l'environnement changeant de l'édition et l'archivage . La
plupart des publications scientifiques sont disponibles sur l'Internet, ce
qui rend leur traitement et l'archivage systématique un véritable défi.
Pour une bonne gestion des données
scientifiques qui passent par l'Internet, celles-ci doivent être facile à classer sans ou avec peu
d'intervention manuelle, ce qui nécessite l'intégration des métadonnées. Les métadonnées explicites facilitent le travail des fournisseurs de contenu, des
gestionnaires d'actifs numériques et des utilisateurs peu expérimentés parce
que ces
sources sont automatiquement classés et indexés pour la recherche à travers une collection de documents
- les publications revues et publiées sont plus faciles à localiser et è citer
- le partage des informations, même en réseaux interdisciplinaires, est facilitée
- la notoriété des auteurs devient plus évidant
- pas besoin de chasser les métadonnées sur
Internet pour la citation, particulièrement bénéfique pour les étudiants qui manquent de
patience ou les moyens de localiser les référentiels pertinents
- des
citations et des références bibliographiques peuvent être générés hors
ligne, un must pour les articles auto-édité, travaux en cours et le
contenu éditorial.
Normes de métadonnées
Des dizaines de standards de métadonnées sont actuellement disponibles, chacun étant liée à son propre vocabulaire. Malheureusement, aucune des normes est universellement applicable. Un
étudiant cherche les données pour générer des citations tandis qu'un
ingénieur cherche dans sa collection un document spécifique, employant
des critères
techniques. Les Informations
sur un éditeur de livres, les droits d'auteur d'un image ou d'une
peinture, l'auteur d'un chansons, ou l'architecte des pyramides antiques
sont toutes des métadonnées et les attributs de ces éléments. Les métadonnées
sont traitées pour classer les éléments dans les moteurs de recherche
pour les partager avec la communauté mondiale. Différents utilisateurs cherchent différentes données. Critiques d'art, des spécialistes vétérinaires, des physiciens et des
avocats téléchargent régulièrement du contenu provenant d'autres disciplines et ils préfèrent le faire sans intervention
manuelle, reposant sur les métadonnées intégrées.
Les bibliothèques universitaires et publiques sont appelées à améliorer
leurs services et à contribuer plus activement à la recherche
scientifique. Bien
qu'ils préfèrent intégrer et de préserver les métadonnées de tous leurs
documents dans les catalogues internes, mais puisque l'un n'exclut pas l'autre, il faut aussi intégrer une sélection descriptive de ces métadonnées dans une ressource numérique à la disposition des utilisateurs pour
consultation hors ligne et le référencement. Et il leur sauve du temps.
Une notation du type l'attribut / valeur est probablement suffisante pour la plupart des utilisateur.
Si l'incorporation directe est impossible (par
exemple en raison de la somme de contrôle), on peut toujours attacher un ficher XMP (Extensible Metadata Platform - Adobe) contenant les métadonnées.
Une solution pragmatique
Documents avec métadonnées intégrées augmentent progressivement au libre accès des dépôts et sur les sites des éditeurs. Il est dû en partie aux exigences institutionnelles pour fournir des métadonnées avec les documents. De
nouvelles formes de métadonnées telles que celles sur des pages HTML
pointant vers Facebook et Twitter sont constamment en développement. Variables spécifiques de citations sont actuellement utilisés en conjonction avec Citation Style Language (CSL). Et,
d'ajouter à l'enchevêtrement, il ya un large éventail d'espaces de noms
de propriété, où chaque organisation définit les métadonnées
spécifiques pour différents sujets. Un
document peut donc inclure des centaines de variables de métadonnées,
qui peuvent ou peuvent ne pas être significative pour les utilisateurs. Solution à cette question devrait être universel. Je suggère un ensemble de métadonnées extensible individuellement et universellement applicable qui appuie sur le
largement
utilisé la norme Dublin Core (moins raffinements) ainsi qu'un nombre
illimité de paires personnalisables attribut / valeur pour les données. Considérez
cela comme un autre profil Dublin Core d'application (PACD) pour les
personnes qui peuvent ou peuvent ne pas avoir à compter sur une norme
unique délivré par une institution mère. Pour l'échange de métadonnées avec des tiers, il se fonde sur la technologie XMP d'Adobe®.
Une solution pragmatique
On
voit de plus en plus des documents avec métadonnées intégrées dans les
archives libres d'accès et sur les sites des éditeurs. Ceci est dû en partie aux exigences institutionnelles pour fournir des métadonnées avec les documents. De
nouvelles formes de métadonnées telles que celles sur des pages HTML
pointant vers Facebook et Twitter sont constamment en développement. Variables spécifiques de citations sont actuellement utilisés en conjonction avec Citation Style Language (CSL). Et pour compliquer les choses, il y a un large éventail d'espaces de noms
de propriété, où chaque organisation définit les métadonnées
spécifiques pour différents sujets. Un
document peut donc inclure des centaines de variables de métadonnées,
qui peuvent ou peuvent ne pas être significatives pour les utilisateurs. La solution à ce problème devrait être universel. Un ensemble individuellement extensible de métadonnées et universellement applicable qui s'appuie sur la norme Dublin Core (moins les raffinements) ainsi qu'un nombre
illimité de paires personnalisables attribut / valeur pour les données. Considérez
cela comme un autre profil Dublin Core d'application (PACD) pour les
personnes qui peuvent ou peuvent ne pas avoir à compter sur une norme
unique délivré par une institution mère. Pour l'échange de métadonnées avec des tiers, il se fonde sur la technologie XMP d'Adobe®.
Qui devrait fournir et incorporer les métadonnées?La responsabilité ultime de l'inclusion de métadonnées réside avec l'éditeur. Cependant, tous les autres intervenants de l'auteur au distributeur
d'un document, devraient également contribuer en ajoutant des
métadonnées pour les versions finales de leurs documents car
- les auteurs
connaissent leur sujet le mieux et devraient proposer des balsies pertinents
pour les résumés et des citations de leurs articles. Idéalement, ils devraient générer une liste et de la soumettre avec leurs manuscrits. Les fichiers attachés en format XMP sont probablement la meilleure option pour assurer l'intégrité de leurs métadonnées
- les réviseurs peuvent suggérer des changements aux titres et les descriptions en plus des ajustements faits
- les éditeurs et traducteurs peuvent inclure d'autres données et
ajouter des mots clés pour optimiser les
moteurs de recherche
- les éditeurs peuvent adapter les métadonnées et ajouter des détails
tels que les licences Creative Commons, droits d'auteur, les détails des
dates de soumission et d'acceptation, et les identificateurs ISSN /
DOI.
- les
bibliothèques et les fournisseurs de contenu, qui rassemblent les
métadonnées pour leurs catalogues, devraient veiller à ce que des
métadonnées utiles accompagne chaque document pour la classification
automatique, l'indexation et la récupérabilité.
Ajout de métadonnées aux fichiers PDF
La technologie XMP d'Adobe® ™ est bien adapté pour l'incorporation des métadonnées. Ce format est mis en œuvre dans les documents PDF. Il y a des espaces réservés pour les éléments Dublin Core et d'autres types de méta standard tels que Dicomed pour des applications médicales et IPTC qui est utilisé par la communauté internationale de la presse et les photographes professionnels pour sécuriser leurs droits d'auteur. Il permet également de définir des ensembles exclusifs avec leurs propres espaces de noms ainsi que un nombre illimité de pairs attribut/valeur personnalisés qui peuvent être utilisés pour décrire n'importe quelque chose. Pour visualiser, éditer et exporter des métadonnées, un logiciel approprié (gratuits ou peu coûteux) est nécessaire. Pour incorporer ceux-ci dans un document PDF Acrobat ou un autre outil de PDF qui peuvent importer des fichiers XMP sont utilisés.