Lune Rouge

TextStat 3.0

Un programme libre de Lionel Allorge

Par : Lionel Allorge

Sommaire => Français => Logiciels libres => Textstat

Générez une étude statistique sur un fichier texte :

ts3_f.jpg
copie d’écran

Vous pouvez télécharger le programme (binaires) pour Windows (606 ko) : textstat_win32.zip

Vous pouvez télécharger les sources (85 ko) : textstat_sources.zip

 

Ce programme permet de faire l’analyse statistique d’un texte en comptant un certain nombre de paramètres comme le nombre de lettres, de mots, de phrases.

Il estime le nombres de syllabes et calcule le degré de lisibilité de Flesch (voir ci-dessous).

Il fournit également un tableau de tous les mots du texte avec le nombre d’occurrences.

Il peut aussi, de manière optionnelle, vérifier si un mot est répété deux fois de suite (à X mots d’intervalle).

 

Analyse d’un texte :

Ce programme lit les fichiers texte brut et les fichiers HTML. Si votre document est dans un autre format, vous devez d’abord l’exporter vers le format texte brut (texte seul) ou HTML.

Vous lancez le programme TextStat. Dans la zone "Fichier à étudier", vous entrez le nom de votre fichier texte. Le bouton au-dessus vous permet de choisir un fichier. Vous pouvez préciser si le texte est en HTML auquel cas les balises HTML seront ignorées.

Dans la zone "Fichier résultat", vous entrez le nom d’un fichier qui contiendra l’ensemble de la statistique. Le bouton au-dessus vous permet de choisir un fichier. Vous pouvez préciser un fichier au format texte ou HTML.

Vous pouvez alors lancer la statistique en cliquant sur le bouton ’TS". Le traitement peut être assez long pour les gros fichiers. Une fois le traitement terminé, dans la zone de droite, vous verrez alors s’afficher le résultat de la statistique. Ce résultat est aussi sauvegardé dans le "fichier résultat" pour que vous puissiez le consulter dans un autre programme.

Plusieurs options vous permettent de paramétrer cette statistique :

Vous pouvez modifier la liste des séparateurs de mots et de phrases.

Vous pouvez demander au programme d’ignorer la différence entre majuscules et minuscules et entre caractères accentués ou non en cochant les cases appropriées.

Vous pouvez aussi indiquer que le fichier utilise la table de caractères DOS (ASCII) au lieu de l’ANSI.

Vous pouvez aussi demander une recherche de répétitions de mots. Ceci dans le but d’éviter l’utilisation d’un même mot dans un court intervalle de texte. Pour cela, vous devez cocher la case et définir le nombre de mots d’écarts pour l’intervalle. Vous pouvez aussi définir une liste de mots à ignorer dans cette recherche car sinon le résultat risque de devenir inutilisable.

 

Degré de lisibilité de Rudolf Flesch :

Pour une explication détaillée, voir ici (en Anglais)

Une valeur élevée correspond à un texte dont la lecture est considérée comme facile.

Une valeur faible correspond à un texte dont la lecture est considérée comme difficile.

Cette méthode repose sur l’utilisation de la formule suivante :

206,835 - (1,015 x moyenne de mots par phrase) - (84,6 x moyenne de syllabes par mots)

Tableau d’interprétation de ce test :

Degré Niveau de difficulté
90-100 Très facile
80-90 Facile
70-80 Assez facile
60-70 Standard
50-60 Assez difficile
30-50 Difficile
0-30 Très difficile

 

Le programme d’installation a été réalisé avec ce très bon outil : Inno Setup 1.3

Actuellement, ce programme fonctionne en Français et en Anglais. Si vous voulez le traduire dans d’autres langues, merci de m’envoyer un email : lionel.allorge@lunerouge.org

Tous les commentaires sont bienvenus.

Historique :

Version 3.0 : Réecriture avec la librairie wxWindows. Lecture et affichage des fichiers HTML. Fournit sous licence GNU GPL

Version 2.0 : Ajout de la détection de répétitions.

Version 1.0 : Première version publique sous forme de freeware.

License :

Ce programme est fournit sous GNU GPL


Ce projet est présent sur :

sflogo-88-1.jpg


Merci d’envoyer commentaires ou bugs à : Lionel Allorge


Lien vers la page de l'April sur le brevet unitaire
Aidez-nous à lutter contre les brevets logiciels

L'Union Européenne envisage d'autoriser le dépôt de brevets sur les logiciels ce qui met en danger les auteurs indépendants et les petites sociétés qui réalisent notamment des logiciels libres très et qui ne pourront déposer ou se défendre contre de tels brevets au coût prohibitif.

Merci de contacter votre député européen (appel gratuit).

Pour nous contacter, envoyez un courriel au webmestre. Copyright ©
Lune Rouge