Lune Rouge

Les formats de fichiers

Par : Lionel Allorge

Sommaire => Français

Introduction :

Les formats de fichier fermés emprisonnent vos données ! Ne les utilisez pas !

C’est une lapalissade que de constater que nous confions de plus en plus de données à des ordinateurs. Nous utilisons pour cela des logiciels qui placent ces données dans des fichiers. Ces fichiers répondent à une organisation interne que l’on appelle le format.

Les formats ouverts sont des formats de fichiers dont les spécifications sont publiées intégralement et sont librement utilisables. Ils doivent être documentés, de préférence avec des exemples de code source. Ils ne doivent pas être soumis à des brevets. Ils peuvent être créés par des auteurs indépendants, des consortiums, des sociétés privés... Comme les spécifications sont disponibles, on peut trouver ou écrire soi-même un programme pour lire ces fichiers et récupérer ou convertir le contenu. Cette liberté est fondamentale car même si le programme qui a servit à créer ces fichiers ne fonctionne plus ou n’est plus disponible, il sera toujours possible dans le futur d’en relire le contenu. Au contraire, les formats de fichiers propriétaires, eux n’apportent aucune garantie quant à la pérennité des données dans le temps. En effet, il suffit que l’éditeur du programme cesse de le maintenir et que le programme ne tourne pas sur de nouveaux systèmes pour que l’on se retrouve avec ses données littéralement perdues, car les fichiers qui les contiennent seront devenus inexploitables.

Devant ce danger, il convient de vérifier que les formats de fichiers que vous utilisez sont bien des formats ouverts.

Les tableaux ci-dessous se proposent de vous y aider en récapitulant les principales informations sur les principaux formats de fichiers. Il est impossible d’être exhaustif dans ce domaine, de nouveaux formats apparaissant chaque jour. En cas de doute, demandez au créateur de votre logiciel si son format est bien ouvert.


Formats ouverts (à utiliser de préférence) :

Nom

Description

Définition

Licence

HTML ou HTM (Hyper Text Markup Language) Format de description de page. W3 W3C Licence
JPEG ou JPG (Joint Photographic Experts Group) Format d’image bitmap utilisé sur le Net. Organisme officiel : JPEG
Voir aussi  : IJG
Placé dans le domaine public par C-Cube Microsystems (JFIF).
GIF Format graphique limité à 256 couleurs Ce format utilise une forme de compression nommée LZW (Lempel-Ziv-Welch) qui était sous brevet de la société Unisys.
Une campagne avait été lancée contre ce format : Burn all Gifs
La plupart des programmes libres permettant de les relire comme : The GIMP
MIDI ou MID Format audio ne codant que les notes de musique et non pas le son. Ce format est destiné à contrôler des instruments de musiques électronique mais peut aussi être joué par la plupart des cartes son modernes via une banque de sons. Voir : MIDI Manufacturers Association (MMA).
La documentation complète est payante.
Copyright MMA.
MJPEG ou MotionJPEG Utilisation du JPEG sur chaque image d’une vidéo permettant d’obtenir une compression vidéo. JPEG Placé dans le domaine public par C-Cube Microsystems (JFIF).
Xvid Format audio vidéo compressé basé sur la norme MPEG4. Xvid.org GNU GPL
MNG (Multiple-image Network Graphics) Format d’image bitmap pour l’animation. LibPNG W3C Licence
OpenGL ou Mesa Librairie d’affichage de graphiques 3D.
Bien que contrôlée par Silicon Graphics, il existe une implémentation libre.
OpenGL et Mesa Différents copyrights.
Pour Mesa : Mesa copyright
Ogg Vorbis (OGG) Format audio compressé (équivalent voir meilleur que le MP3). OGG License BSD
Ogg Theora (OGV) Format vidéo compressé (basé sur le codec VP3 de On2 Technologies.). Theora License BSD
PDF Format de présentation de documents de Adobe. Ce format est documenté par Adobe. Format normalisé par l’ISO
PHP Format de script utilisé sur le Net. PHP Licence PHP
PNG (Portable Network Graphics) Format d’image bitmap utilisé sur le Net. Home page
Voir aussi : PNG
W3C Licence
PERL ou PL Langage de programmation PERL Artistic Licence
PYTHON ou PY Langage de programmation Python Inconnue
SGML Format de description de page. SGML
Voir aussi cette documentation en français
Inconnue
SMIL (Synchronized Multimedia Integration Language) Format et langage de description de présentations multimédia (ISO 8879). SMIL W3C Licence
SVG (Scalable Vector Graphics) Format et langage de description de graphiques vectoriels ou bitmap. SVG W3C Licence
Tex / Latex Format de description de texte. TUG Rendu libre par son auteur Donald Knuth.
TXT Format de texte brut sans enrichissements. Le texte est directement codé suivant la norme ASCII ou ANSI. A cause du codage utilisé pour la fin des lignes (retour chariot) les textes ne sont pas forcement compatibles entre Ms Dos, Ms Windows, Unix et MacOs.
C’est pourquoi on lui préférera si possible le format HTML.
ASCII ANSI Inconnue
vCard ou VCF Format d’échange de carte de visite. PDI Inconnue
XCF Format d’image bitmap utilisé par le programme The GIMP. GIMP License GNU GPL
XDB (Xbase) aussi DBF, NDX, MDX Format de base de donnée compatible avec le format dBase de Borland ainsi que Clipper et FoxPro. XDB Licence GNU LGPL
XML (eXtended Markup Language) Format de description de page.
Attention, le XML n’est considéré comme libre que s’il est fournit avec son descriptif.
XML
Voir aussi Lien
W3C Licence
OpenCola Format de boisson non alcoolisée libre ! Open Cola Open source


Quelques exemples de formats propriétaires à éviter :

Nom

Description

Status

Lecteurs libres

AVI (Audio Video Interleaved) Format audio vidéo de Ms Windows. Ce format est documenté par Microsoft. Mais il n’est qu’une coquille qui contient des données généralement compressées par un codec qui est lui rarement publié. Il existe des programmes libres permettant de les relire si l’on dispose des codecs : Mplayer
BMP (BitMaP) Format de fichier d’image de Ms Windows. Ce format est documenté par Microsoft. Il existe des programmes libres permettant de les relire comme : The GIMP
DOC Format de fichier du traitement de texte Microsoft Word. Le format est tenu secret par Microsoft. Il existe des programmes libres permettant de les relire partiellement : WvWare et la suite OpenOffice.org
JAVA Langage de programmation Ce langage est sous le contrôle de la société Sun Microsystems Il n’existe pas d’implémentation libre des librairies (voir projet Gnome).
MPEG (1, 2, 4) Formats audio vidéo compressés. Ces formats sont documentés par le consortium MPEG (mais la documentation est payante).
Ils contiennent des algorithmes brevetés et les formats apparement sont sous copyright.
Il existe pourtant une norme ISO sur le format MPEG (ISO/IEC 14496:1999) qui rend normalement les brevets inopérants !
Il existe des encodeurs libres comme : ffmpeg. Il existe des lecteurs libres comme : xmms et Mplayer
MP3 (MPEG 1 Audio layer 3) Format de compression audio faisant partit de la norme MPEG1 mais soumit à des brevets de Thompson Multimédia et du Fraunhoffer Institute. Ce format est documenté par le consortium MPEG mais la documentation est payante.
Les programmes qui encodent du MP3 se voient réclamer des redevances par les possesseurs des brevets.
Il existe des encodeurs libres comme : LAME. Il existe des lecteurs libres comme : FreeAmp
RTF (Rich Text File) Format de fichier du traitement de texte Ms Word. Ce format est partiellement documenté par Microsoft. Génération possible via la librairie : Panda. Lecture possible par des traitements de textes libres type : Abiword ou OpenOffice.org
SWF (ShockWave-Flash) Format d’animation verctorielle et bitmap 2D propriété de MacroMedia. Ce format est documenté par MacroMedia mais de manière semble-t-il incomplète.
Il existe une description plus complète par le groupe Open SWF : OpenSWF
Génération possible avec : JGenerator. Lecture possible grâce au plug-in : Plug-In
TIFF (Tagged Image File Format) Format d’image bitmap.
Certaines images TIFF utilisent une forme de compression nommée LZW (Lempel-Ziv-Welch) et qui était sous brevet de la société Unisys.
TIFF Copyright Adobe Systems (anciennement Aldus)
WMF Format d’images vectorielle utilisé sous Ms Windows. Ce format est documenté par Microsoft. Lisible dans certains programmes libres comme : KWord et GIMP
ZIP Format de compression de fichiers très utilisé sous Ms Windows. Ce format à été renversé. Il existe un programme libre Gzip et une librairie libre : Zlib.


Liens :

Formats-ouverts.org :http://formats-ouverts.org/
Site proposant de nombreux articles sur les formats ouverts et leur utilisation.

Advanced Authoring Format : http://www.aafassociation.org/
Promotion d’un nouveau format de fichier ouvert permettant d’echanger des contenus multimédias entre applications.

The Document Formats Domain : http://www.w3.org/DF/
Page de base pour les formats de fichiers proposés par le W3C (en anglais).

Xvid : http://fr.wikipedia.org/wiki/Xvid
Codec basé sur la norme MPEG4, permettant de compresser fortement des fichiers vidéos avec une qualité acceptable.

Ogg Vobis : http://fr.wikipedia.org/wiki/Vorbis
Format de fichiers audio compressé ouvert.

Ogg Theora : http://fr.wikipedia.org/wiki/Ogg_Theora
Format de fichiers vidéo compressé ouvert.

World Wide Web Consortium (W3C) : http://www.w3.org/
Comité qui développe les normes pour Internet (en anglais).

Wotsit’s Format : http://www.wotsit.org/
Site de référence sur les formats de fichiers (en anglais).


Merci d’envoyer commentaires ou corrections à l’auteur : Lionel Allorge : lionel.allorge@lunerouge.org

Version 1.0 du 2/11/2008

Copyleft Lionel Allorge
Ce texte est distribuées sous la licence GNU FDL. Vous pouvez le copier et le modifier dans le respect de cette licence.


Lien vers la page de l'April sur le brevet unitaire
Aidez-nous à lutter contre les brevets logiciels

L'Union Européenne envisage d'autoriser le dépôt de brevets sur les logiciels ce qui met en danger les auteurs indépendants et les petites sociétés qui réalisent notamment des logiciels libres très et qui ne pourront déposer ou se défendre contre de tels brevets au coût prohibitif.

Merci de contacter votre député européen (appel gratuit).

Pour nous contacter, envoyez un courriel au webmestre. Copyright ©
Lune Rouge