HTML est le format le plus incontrôlée de tous en termes de métadonnées intégrées et il y a littéralement des centaines d'applications qui peuvent le créer, en ajoutant chaque sa propre saveur de la syntaxe et de son exécution.
Alors que le <meta name = marquage> <head> bloc est généralement respectée par tous, nous avons vu les excès les plus fantaisistes de ce qui suit après le symbole d'égalité.
De loin ne pas tous les auteurs utilisent <dc ... ou <dc.terms ... et souvent ceux qui le font ajoutent des désignations inventés. Récemment, nous avons vu des étiquettes personnalisées avec des préfixes Facebook et Twitter qui contiennent souvent des valeurs spéfifiques pour les citations.
Tout logiciel approprié doit contenir un outil qui permet l’association des méta noms inhabituels à dc.elements valides, dc.terms, les variables de citation ou paires valeur / attribut personnalisées, et ceci même avant le document ou le lien et ajouté à une collection.
Un autre problème avec les fichiers HTML, est que beaucoup sont virtuelles ou créées programmatique, par exemple, en réponse à une question, et beaucoup sont le résultat de multiples re-dirctions et ne sont pas nécessairement le fichier que l'utilisateur pensait avoir cliqué dans un premier temps. Cela se produit généralement sur des sites construits avec des jeux de cadres ou des pages de maître avec de nombreux liens.
Télécharger un tel fichier peut produire un document de taille nulle. Il est donc recommandé que tous les téléchargements soit vérifiés avant de les ajouter à une collection.
Pour cette raison, digi-libris affiche le cheminement de tous les fichiers qui ont été ouverts au cours d'un simple clic sur un lien.