Statistiques XML
Analyser le contenu d’un document XML (balises, texte, mots)
Pourquoi
- 2 Mo d’XML, cela fait un texte de combien de signes ?
- Est-ce que la balise <toto> est vraiment utilisée ?
- Quelle est la part du texte cité (ex : <quote>) ?
- Quels sont les mots les plus fréquents du corpus ?
- Comment repérer les erreurs de termes dans un attribut ?
Comment
- Choisir un corpus ci dessous, ou bien ajouter des documents XML à votre session
- Générer la table des balises
- Cliquer un nom de balise pour en lister le texte