Introduction :
Les formats de fichier fermés emprisonnent vos données ! Ne les utilisez pas !
C’est une lapalissade que de constater que nous confions de plus en plus de données à des ordinateurs. Nous utilisons pour cela des logiciels qui placent ces données dans des fichiers. Ces fichiers répondent à une organisation interne que l’on appelle le format.
Les formats ouverts sont des formats de fichiers dont les spécifications sont publiées intégralement et sont librement utilisables. Ils doivent être documentés, de préférence avec des exemples de code source. Ils ne doivent pas être soumis à des brevets. Ils peuvent être créés par des auteurs indépendants, des consortiums, des sociétés privés... Comme les spécifications sont disponibles, on peut trouver ou écrire soi-même un programme pour lire ces fichiers et récupérer ou convertir le contenu. Cette liberté est fondamentale car même si le programme qui a servit à créer ces fichiers ne fonctionne plus ou n’est plus disponible, il sera toujours possible dans le futur d’en relire le contenu. Au contraire, les formats de fichiers propriétaires, eux n’apportent aucune garantie quant à la pérennité des données dans le temps. En effet, il suffit que l’éditeur du programme cesse de le maintenir et que le programme ne tourne pas sur de nouveaux systèmes pour que l’on se retrouve avec ses données littéralement perdues, car les fichiers qui les contiennent seront devenus inexploitables.
Devant ce danger, il convient de vérifier que les formats de fichiers que vous utilisez sont bien des formats ouverts.
Les tableaux ci-dessous se proposent de vous y aider en récapitulant les principales informations sur les principaux formats de fichiers. Il est impossible d’être exhaustif dans ce domaine, de nouveaux formats apparaissant chaque jour. En cas de doute, demandez au créateur de votre logiciel si son format est bien ouvert.
Formats ouverts (à utiliser de préférence) :
Nom |
Description |
Définition |
Licence |
| HTML ou HTM (Hyper Text Markup Language) |
Format de description de page. |
W3 |
W3C
Licence |
| JPEG ou JPG (Joint Photographic Experts Group) |
Format d’image bitmap utilisé sur le Net. |
Organisme officiel : JPEG Voir aussi
: IJG |
Placé dans le domaine public par C-Cube Microsystems (JFIF). |
| GIF |
Format graphique limité à 256 couleurs |
Ce format utilise une forme de compression nommée LZW (Lempel-Ziv-Welch) qui était sous brevet de la société Unisys.
Une campagne avait été lancée contre ce format : Burn all Gifs |
La plupart des programmes libres permettant de les relire comme : The GIMP |
| MIDI ou MID |
Format audio ne codant que les notes de musique et non pas le son. Ce
format est destiné à contrôler des instruments de musiques électronique mais peut
aussi être joué par la plupart des cartes son modernes via une banque de sons. |
Voir : MIDI Manufacturers Association (MMA). La documentation complète est payante. |
Copyright MMA. |
| MJPEG ou MotionJPEG |
Utilisation du JPEG sur chaque image d’une vidéo permettant d’obtenir une compression vidéo. |
JPEG |
Placé dans le domaine public par C-Cube Microsystems (JFIF). |
| Xvid |
Format audio vidéo compressé basé sur la norme MPEG4. |
Xvid.org |
GNU GPL |
| MNG (Multiple-image Network Graphics) |
Format d’image bitmap pour l’animation. |
LibPNG |
W3C Licence |
| OpenGL ou Mesa |
Librairie d’affichage de graphiques 3D.
Bien que contrôlée par Silicon Graphics, il existe une
implémentation libre. |
OpenGL et Mesa |
Différents copyrights. Pour Mesa : Mesa copyright |
| Ogg Vorbis (OGG) |
Format audio compressé (équivalent voir meilleur que le MP3). |
OGG |
License BSD |
| Ogg Theora (OGV) |
Format vidéo compressé (basé sur le codec VP3 de On2 Technologies.). |
Theora |
License BSD |
| PDF |
Format de présentation de documents de Adobe. |
Ce format est documenté par Adobe. |
Format normalisé par l’ISO |
| PHP |
Format de script utilisé sur le Net. |
PHP |
Licence PHP |
| PNG (Portable Network Graphics) |
Format d’image bitmap utilisé sur le Net. |
Home page Voir aussi : PNG |
W3C
Licence |
| PERL ou PL |
Langage de programmation |
PERL |
Artistic Licence |
| PYTHON ou PY |
Langage de programmation |
Python |
Inconnue |
| SGML |
Format de description de page. |
SGML Voir aussi cette documentation en français |
Inconnue |
| SMIL (Synchronized Multimedia Integration Language) |
Format et langage de description de présentations multimédia (ISO 8879). |
SMIL |
W3C
Licence |
| SVG (Scalable Vector Graphics) |
Format et langage de description de graphiques vectoriels ou bitmap. |
SVG |
W3C
Licence |
| Tex / Latex |
Format de description de texte. |
TUG |
Rendu libre par son auteur Donald Knuth. |
| TXT |
Format de texte brut sans enrichissements. Le texte est directement codé
suivant la norme ASCII ou ANSI. A cause du codage utilisé pour la fin des lignes (retour
chariot) les textes ne sont pas forcement compatibles entre Ms Dos, Ms Windows, Unix et
MacOs.
C’est pourquoi on lui préférera si possible le format HTML. |
ASCII ANSI |
Inconnue |
| vCard ou VCF |
Format d’échange de carte de visite. |
PDI |
Inconnue |
| XCF |
Format d’image bitmap utilisé par le programme The GIMP. |
GIMP |
License GNU GPL |
| XDB (Xbase) aussi DBF, NDX, MDX |
Format de base de donnée compatible avec le format dBase de Borland ainsi que Clipper et FoxPro. |
XDB |
Licence GNU LGPL |
| XML (eXtended Markup Language) |
Format de description de page.
Attention, le XML n’est considéré comme libre que s’il est fournit avec son descriptif. |
XML
Voir aussi Lien |
W3C
Licence |
| OpenCola |
Format de boisson non alcoolisée libre ! |
Open
Cola |
Open source |
Quelques exemples de formats propriétaires à éviter :
Nom |
Description |
Status |
Lecteurs libres |
| AVI (Audio Video Interleaved) |
Format audio vidéo de Ms Windows. |
Ce format est documenté par Microsoft. Mais il n’est qu’une coquille qui contient des données généralement compressées par un codec qui est lui rarement publié. |
Il existe des programmes libres permettant de les relire si l’on dispose des codecs : Mplayer |
| BMP (BitMaP) |
Format de fichier d’image de Ms Windows. |
Ce format est documenté par Microsoft. |
Il existe des programmes libres permettant de les relire comme : The GIMP |
| DOC |
Format de fichier du traitement de texte Microsoft Word. |
Le format est tenu secret par Microsoft. |
Il existe des programmes libres permettant de les relire partiellement : WvWare et la suite OpenOffice.org |
| JAVA |
Langage de programmation |
Ce langage est sous le contrôle de la société Sun Microsystems |
Il n’existe pas d’implémentation libre des librairies (voir projet Gnome). |
| MPEG (1, 2, 4) |
Formats audio vidéo compressés. |
Ces formats sont documentés par le consortium MPEG (mais la documentation
est payante).
Ils contiennent des algorithmes brevetés et les formats apparement sont sous copyright.
Il existe pourtant une norme ISO sur le format MPEG (ISO/IEC 14496:1999) qui rend
normalement les brevets inopérants ! |
Il existe des encodeurs libres comme : ffmpeg. Il existe des lecteurs libres comme : xmms et Mplayer |
| MP3 (MPEG 1 Audio layer 3) |
Format de compression audio faisant partit de la norme MPEG1 mais soumit à des brevets de Thompson Multimédia et du Fraunhoffer Institute. |
Ce format est documenté par le consortium MPEG mais la documentation est payante.
Les programmes qui encodent du MP3 se voient réclamer des redevances par les possesseurs des brevets. |
Il existe des encodeurs libres comme : LAME. Il existe des lecteurs libres comme : FreeAmp |
| RTF (Rich Text File) |
Format de fichier du traitement de texte Ms Word. |
Ce format est partiellement documenté par Microsoft. |
Génération possible via la librairie : Panda. Lecture possible par des traitements de textes libres type : Abiword ou OpenOffice.org |
| SWF (ShockWave-Flash) |
Format d’animation verctorielle et bitmap 2D propriété de MacroMedia. |
Ce format est documenté par MacroMedia mais de manière semble-t-il incomplète.
Il existe une description plus complète par le groupe Open SWF : OpenSWF |
Génération possible avec : JGenerator. Lecture possible grâce au plug-in : Plug-In |
| TIFF (Tagged Image File Format) |
Format d’image bitmap.
Certaines images TIFF utilisent une forme de compression nommée LZW (Lempel-Ziv-Welch) et qui était sous brevet de la société Unisys. |
TIFF |
Copyright Adobe Systems (anciennement Aldus) |
| WMF |
Format d’images vectorielle utilisé sous Ms Windows. |
Ce format est documenté par Microsoft. |
Lisible dans certains programmes libres comme : KWord et GIMP |
| ZIP |
Format de compression de fichiers très utilisé sous Ms Windows. |
Ce format à été renversé. |
Il existe un programme libre Gzip et une librairie libre : Zlib. |
Liens :
Formats-ouverts.org :http://formats-ouverts.org/
Site proposant de nombreux articles sur les formats ouverts et leur utilisation.
Advanced Authoring Format : http://www.aafassociation.org/
Promotion d’un nouveau format de fichier ouvert permettant d’echanger des contenus
multimédias entre applications.
The Document Formats Domain : http://www.w3.org/DF/
Page de base pour les formats de fichiers proposés par le W3C (en anglais).
Xvid : http://fr.wikipedia.org/wiki/Xvid
Codec basé sur la norme MPEG4, permettant de compresser fortement des fichiers vidéos avec une qualité acceptable.
Ogg Vobis : http://fr.wikipedia.org/wiki/Vorbis
Format de fichiers audio compressé ouvert.
Ogg Theora : http://fr.wikipedia.org/wiki/Ogg_Theora
Format de fichiers vidéo compressé ouvert.
World Wide Web Consortium (W3C) : http://www.w3.org/
Comité qui développe les normes pour Internet (en anglais).
Wotsit’s Format : http://www.wotsit.org/
Site de référence sur les formats de fichiers (en anglais).
Merci d’envoyer commentaires ou corrections à l’auteur :
Lionel Allorge : lionel.allorge@lunerouge.org
Version 1.0 du 2/11/2008
Copyleft Lionel Allorge
Ce texte est distribuées sous la licence GNU FDL.
Vous pouvez le copier et le modifier dans le respect de cette licence.