| |
On assiste, avec le développement d'Internet, à un
apport de plus en plus grand de composantes multimédia
et interactives dans les sites Web. Bien que plusieurs de
ces composantes s'intègrent de façon transparente aux pages Web,
les utilisateurs d'Internet rencontrent souvent des formats de fichiers
qui peuvent nécessiter l'utilisation de logiciels particuliers.
Nous avons voulu, dans cette page, donner les informations de base
sur les principaux formats de fichiers rencontrés
dans Internet. Il s'agit donc d'une introduction seulement,
limitée aux fichiers de nature documentaire.
L'emphase est mise sur les gratuiciels et partagiciels pour
Windows et Macintosh requis pour lire ou décoder ces
fichiers.
Les différents formats sont ici regroupés en grandes catégories
et ils sont introduits par
leur extension de fichier. Cette dernière consiste en trois ou
quatres caractères alphanumériques terminant le nom du fichier
et précédés d'un point. Par exemple, un fichier dont le nom
est menuet.txt possède
l'extension de fichier .txt.
Les fichiers d'ordinateurs sont de deux types : ASCII ou binaires.
Les premiers sont constitués de caractères qui respectent
les codes ASCII. Ceux-ci définissent l'ensemble des caractères
typographiques pouvant être reproduits à l'écran d'un
ordinateur. En soi, les fichiers ASCII ne contiennent aucun élément
de formatage ou de présentation (hormis les sauts de lignes). Ces
fichiers ne sont pas limités à contenir du texte. Cependant,
on pourra toujours les afficher avec un éditeur, même s'ils
ne contiennent que de longues suites de caractères. Quant aux fichiers
binaires, ils contiennent des informations codées directement en
binaire (des 0 et des 1). Pour afficher ou exécuter un fichier
binaire, il faut utiliser un logiciel compatible avec celui qui l'a créé.
Il est utile de connaître le type de fichier auquel on a affaire
lorsqu'on souhaite le télécharger avec un logiciel FTP.
En effet, il est recommandé, avec ces derniers, de spécifier
le type approprié avant de procéder au téléchargement.
1.4.1 Documents textuels
Il s'agit sans doute de la catégorie de fichiers la moins bien
normalisée. Il se dégage tout de même certaines tendances qui
permettent aux internautes de s'y retrouver quelque peu.
.DOC
- [Types binaire ou ASCII].
Cette extension de fichier est utilisée pour représenter
beaucoup de formats de textes. Le logiciel Microsoft Word,
en version Windows, utilise l'extention .doc pour
ses fichiers. Ces derniers sont assez répandus dans Internet.
| Utiliser :
Wordviewer
(Windows) ;
Logiciels de traitement de texte. |
.HTML .HTM .SHTM .SHTML (Hypertext Markup Language)
- [Type ASCII].
Utilisé spécifiquement pour la rédaction de page Web.
Il s'agit d'une application de la norme SGML.
Note. Les fichiers
se terminant par .SHTM et .SHTML désignent
des fichiers qui contiennent des instructions dynamiques de type
SSI (Server Side Include). Ces instructions dynamiques pourraient
être l'affichage de la date courrante, le nombre de fois que la
page a été accédée, ou même une
information extraite d'une base de données.
| Utiliser : Navigateurs Web. |
.PDF (Portable Document Format)
- [Type binaire].
Format du logiciel Acrobat de Adobe. Très
répandu pour la diffusion de documents dans Internet.
.PPT .PPS (PowerPoint Presentation, PowerPoint Slide Show)
- [Type binaire].
Format du logiciel PowerPoint de Microsoft (suite Office), utilisé pour
la production de diapositives électroniques généralement
projetées sur un écran lors de présentations. Ce logiciel
permet aussi de produire des « séances de projection »
(slide shows) où les diapositives, qui contiennent souvent des images encapsulées,
défilent automatiquement.
.PS .EPS (PostScript)
- [Type ASCII].
Également développé par Adobe. Langage de typographie et de mise
en page. Utilisé avec des imprimantes laser conçues pour
interpréter les codes PostScript.
| Utiliser :
GostScript ;
Envoyer directement à une imprimante laser compatible. |
.RTF (Rich Text Format)
- [Type ASCII]. Format de documents textuels normalisé favorisant
l'échange entre différents logiciels et plateformes.
| Utiliser :
Logiciels de traitement de texte. |
.SGML .XML (Standard Generalized Markup Language,
Extensible Markup Language)
- [Type ASCII].
SGML est une norme internationale pour la représentation de documents
textuels en format électronique. Largement utilisé dans l'industrie
de l'édition et les bibliothèques numériques pour la
production et l'archivage de documents électroniques (périodiques,
monographies, etc.). XML est une version
« allégée » de SGML.
Consulter le site
The XML Cover Pages pour de plus amples informations
| Utiliser :
Navigateur Web : en général, les documents XML et SGML qui sont diffusés dans
le Web sont convertis en HTML. Les versions récentes des navigateurs
peuvent afficher directement les fichiers XML.
|
.TEX
- [Type ASCII].
Se prononce comme « tek ».
Utilisé pour la rédaction de textes scientifiques. Il faut un
compilateur (TeX ou LaTeX) pour générer le document formaté.
À la sortie du compilateur, un fichier .dvi (Device
Independent) est produit. Ce dernier devra être converti
pour l'affichage ou l'impression.
.TXT
- [Type ASCII].
Par convention, on donne cette extension aux fichiers de texte en simple
format ASCII. Documents non formatés.
| Utiliser : Navigateurs Web ;
Logiciels de traitement de texte ; Éditeurs de texte
variés (ex. Bloc-note pour Windows, SimpleText
pour Mac). |
1.4.2 Images
.GIF (Graphics Interchange Format)
- [Type binaire]. Format développé par CompuServe basé
sur l'algorithme de compression LZW d'Unisys qui en détient les
droits. Fichiers assez compacts mais images limitées à
un maximum de 256 couleurs. Utilisé pour produire de petites
images peu texturées, des icônes, des boutons dans les
pages Web, etc. Permet la transparence et les images animées.
| Utiliser : Navigateurs Web |
.JPEG .JPG (Joint Photography Experts Group)
- [Type binaire]. Très fréquent dans Internet. Fichiers
très compacts grâce à son algorithme de compression
efficace mais qui provoque des pertes d'information. Utilisé
pour produire des photos et images texturées dans les pages Web.
| Utiliser : Navigateurs Web |
.PNG (Portable Network Graphics)
- [Type binaire]. Appelé à remplacer les formats GIF et JPEG. Norme
publique.
.TIFF .TIF (Tagged Image File Format)
- [Type binaire]. Utilisé pour l'archivage d'images de qualité.
Utilise un algorithme de compression sans perte. Fichiers de relativement
grandes dimensions.
1.4.3 Audio
.AIFF .AIF (Audio Interchange File Format)
- [Type binaire].
Relativement répandu dans Internet.
.AU
- [Type binaire].
Développé pour Unix. Très répandu dans Internet.
.MID (Music Instrument Digital Interface)
- [Type binaire].
Norme pour transmettre des informations musicales entre instruments
électroniques et ordinateurs.
.MP3 (Moving Pictures Expert Group)
- [Type binaire].
Format public pour la numérisation audio en
haute-fidélité (qualité comparable au disque compact).
.RA .RAM (RealAudio)
- [Type binaire].
Format propriétaire pour la diffusion en direct de séquences
sonores et vidéo par Internet.
.WAV (Waveform Audio File Format)
- [Type binaire].
Format utilisé par Windows pour stocker des séquences sonores.
1.4.4 Vidéo
Il ne faut pas s'attendre à trouver des longs métrages
en Dolby stéréo dans Internet (même si, de manière marginale,
il est en fait possible d'en trouver). Les réseaux informatiques
actuels ne permettent pas des débits de données suffisants.
Néanmoins, la vidéo y est bien présente. Il existe
deux méthodes de visualisation de séquences vidéo :
la méthode en différé et la diffusion en direct.
Avec la première méthode, il faut que tout le fichier
ait été téléchargé sur son disque
dur avant que l'on puisse le visionner. La seconde méthode,
au contraire, permet la visualisation pendant le téléchargement.
On comprendra que la qualité des séquences en direct
sera médiocre. De plus, cette dernière nécessite
une connexion très rapide à Internet, sinon les « projections »
risquent d'être saccadées. Les séquences vidéo
transmises en différé pourront être de meilleure
qualité car le temps de téléchargement n'a pas
à être synchronisé avec le temps de visualisation.
(Selon le débit de la connexion Internet, il faudra peut-être une heure pour télécharger
une séquence de quelques minutes.)
Concernant les logiciels de visualisation de vidéos, la plupart de ceux-ci
prennent maintenant en charge les formats courants dans le Web. Dans la liste ci-dessous,
nous proposons le logiciel « natif », lorsqu'applicable, mais
sachez qu'il n'est pas nécessaire d'avoir chacun de ces logiciels pour faire
jouer des vidéos de ces différents formats. En général, un seul suffit.
.AVI (Audio Video Interleave : Video For Windows)
- [Type binaire].
Format vidéo générique pour Windows. Généralement visualisation en
différé. Ce format peut faire appel à différentes techniques de
compression de données grâce à l'utilisation de codec (codeur-décodeur)
spécifiques à ces méthodes. (De ce fait, un fichier AVI particulier peut
ne pas être lisible si le codec auquel il fait appel n'est pas présent
sur son ordinateur.)
.MOV .QT (QuickTime Movie)
- [Type binaire].
Développé par Apple. Commun sur Internet. Excellente qualité
d'image. Généralement visualisation en différé.
.MPEG .MPG (Moving Pictures Expert Group)
- [Type binaire].
Norme publique. Très répandu dans Internet.
Généralement visualisation en différé.
.RA (RealAudio)
- [Type binaire].
Format propriétaire pour la diffusion en direct de séquences
sonores et vidéo par Internet.
.VIV (VivoActive)
- [Type binaire].
Format propriétaire pour la diffusion en direct de séquences vidéo par
Internet. Qualité d'image médiocre mais fichiers très compacts.
1.4.5 Compression, archivage et encodage
Ce type de fichier sont d'une très grande utilité pour
les usagers d'Internet. La fonction de compression de fichiers consiste
à réduire leur taille en applicant un algorithme qui enregistre
l'information sous une forme plus compacte. La fonction d'archivage, quant
à elle, sert à regrouper plusieurs fichiers dans un même
fichier de destination. Les utilitaires d'archivage permettent même
de regrouper des répertoires, des sous-répertoires et tout
leur contenu sous un même fichier. Généralement, ces
deux fonctions de compression et d'archivage se retrouvent simultanément
dans la même application. Certains programmes encodent l'information
contenu dans des fichiers pour d'autres raisons que les deux fonctions
mentionnées précédemment. On retrouve principalement
le cryptage des fichiers, pour raison de sécurité et de
protection de la vie privée (mais nous n'aborderons pas ce sujet
dans la présente introduction) et l'encodage ASCII. C'est ce dernier
type d'encodage qui nous intéresse ici. Il consiste à convertir
des fichiers binaires en fichiers ASCII pour les rendre transmissibles
par courrier électronique ou dans Usenet.
.ACE
- [Type binaire].
Format propriétaire efficace conçu pour archiver et compresser d'énormes fichiers.
Il permet le morcellement en fragments, qui sont rassemblés
lors de la décompression.
| Utiliser :
Windows : QuickZip
(décompression seulement)
|
.BIN
- [Type binaire].
Encodage de fichiers pour Macintosh. Format 8 bits.
.EXE
- [Type binaire].
Fichiers exécutables pour DOS ou Windows. Il s'agit de programmes
proprement dit. On trouve dans Internet des fichiers de ce type qui
sont en fait des archives compressées « auto-extractibles ».
| Utiliser :
Windows seulement : Exécuter le fichier. Décompression
automatique des fichiers contenus dans l'archive.
|
.HQX (BinHex)
- [Type ASCII].
Encodage ASCII de fichiers binaires. Très commun dans Internet pour les
fichiers destinés au Macintosh.
.GZ .GZIP (GNU ZIP)
- [Type binaire].
Compression de fichiers pour la plate-forme UNIX.
.RAR (probablement Roshal Archive, d'après le nom du créateur)
- [Type binaire].
Format propriétaire efficace pour l'archivage et la compression de très gros fichiers.
Il permet le morcellement en fragments. Ceux-ci sont rassemblés
lors de la décompression.
.SIT .SEA (StuffIt archives, self-extracting archives)
- [Type binaire]. Archivage de fichiers pour Macintosh, avec compression.
Format propriétaire de Alladin Systems. Les fichiers .SEA sont
« auto-extractibles ».
.TAR (Tape archive)
- [Type binaire].
Archivage de fichiers pour UNIX, sans compression. Note : dans
Internet, les fichiers TAR sont souvent compressés de surcroît. Ils
prennent ainsi une extension double : .TAR.Z.
Dans ces cas, il faut d'abord décompresser le fichier avant de le
désarchiver. Voir .Z.
.UUE (UUencoding)
- [Type ASCII].
Encodage ASCII (7 bits) de fichiers binaires. Très commun pour le
transfert de fichiers par courrier électronique et dans les forums
Usenet.
| Utiliser :
Mac :
StuffIt Expander.
Windows : QuickZip.
Note. Les clients de courrier électronique et Usenet font souvent le
décodage automatiquement.
|
.Z (Compress)
- [Type binaire].
Compression de UNIX.
.ZIP
- [Type binaire].
Format de compression et d'archivage très commun dans Internet, développé pour
DOS et Windows.
1.4.6 Visualisation tridimensionnelle
La visualisation tridimensionnelle et la réalité virtuelle sont
maintenant choses relativement courantes dans Internet. Le développement
du VRML (Virtual Reality Modeling Language) amène une nouvelle
façon d'accéder aux ressources Internet. Bien que cette technologie
soit encore à un stade expérimental, on trouve bon nombre d'exemples
de mondes virtuels dans lesquels l'internaute peut se déplacer. Pour
ce faire, il doit utiliser un navigateur spécialisé, ou encore un module externe
(plugin) à ajouter à son navigateur Web.
Dans le domaine de la chimie, il existe plusieurs formats de données
pour la représentation de la structure des
molécules. Nous indiquons ci-dessous deux formats utilisés couramment dans les banques de données
rencontrés dans Internet, tel que PDB SearchLite discuté à la
section 3.3.
- Réalité virtuelle
.VRML .WRL .WRZ .VRW (Virtual Reality Modeling Language)
- [Type ASCII].
Fichier décrivant des formes tridimensionnelles et des environnements
interactifs accessibles par le Web.
Il existe deux versions de VRML :1 et 2.
| Utiliser :
CosmoPlayer (module
externe (plugin) pour navigateurs Web.
Aussi, pour une liste de navigateurs et modules de visualisation ainsi que des
renseignements concernant cette technologie, consultez le
VRML Repository.
|
- Chimie
.PDB (Protein Databank)
- [Type ASCII].
Représentation 3D de molécules. Avec un afficheur approprié, on
peut observer une molécule sous tous les angles.
.SPT (RASMol Script File)
- [Type ASCII].
Permet d'enregistrer une séquence d'affichage d'une molécule
(configuration, angles, rotation, etc.)
1.4.7 Données numériques et statistiques
Nous avons regroupé ci-dessous les principaux formats de fichiers
utilisés avec les sytèmes d'information géospatiale
(en anglais geographic information systems, ou GIS) ainsi que
les formats de diffusion de données statistiques les plus importants.
.E00
- [Type ASCII ou binaire si compressé]. Format d'échange de données pour le
sytème d'information
géospatiale
ARC/Info de Environmental Systems Research Institute, Inc.
(ESRI)
| Utiliser :
ArcExplorer
avec Import Utility (Windows seulement).
|
.IVT (du nom de la firme Ivation Datasystems)
- [Type binaire]. Format propriétaire de la firme canadienne
Ivation Datasystems Inc.. Principal format de diffusion
de données
statistiques dans le cadre de l'Initiative de
démocratisation des données
(IDD)
du gouvernement canadien.
| Utiliser :
Beyond 20/20 browser
(Windows seulement ; on ne peut télécharger le logiciel de ce site).
|
.MIF (MapInfo Interchage Format)
- [Type ASCII].
Format d'échange de données pour le sytème d'information
géospatiale
MapInfo. Les fichiers .MIF sont associés à des fichiers de
données d'extension .MID.
.SAS (à l'origine, Statistical Analysis System)
- [Type ASCII].
Initialement développé dans les années soixante-dix,
le progiciel de statistiques SAS à évolué en plusieurs produits
spécialisés.
.SHP (Shape)
- [Type binaire]. Format de données pour le
sytème d'information
géospatiale ARCview de Environmental Systems Research Institute, Inc.
(ESRI).
Peut être associée à des fichiers d'extension telle
que .shx et .dbf.
.SPSS .SPS (Statistical Product and Service Solutions)
-
Développé à la fin des années
soixante sous le nom Statistical Package for the Social Sciences,
ce progiciel de statistiques a évolué en divers produits
spécialisés.
.TAB (MapInfo)
- [Type ASCII].
Format propriétaire de données pour le sytème d'information
géospatiale MapInfo. Le fichier .TAB définit un tableau dans MapInfo. Il est
associé à des fichiers binaires d'extensions
.DAT, .MAP, .ID ou .IND.
|