CREPUQ GIRI - Guide d'initiation à la recherche dans Internet
1. Présentation d'Internet 

   

1.4 Principaux formats de fichiers

1.4.1 Documents textuels
1.4.2 Images
1.4.3 Audio
1.4.4 Vidéo
1.4.5 Compression, archivage et encodage
1.4.6 Visualisation tridimensionnelle
1.4.7 Données numériques et statistiques
 
1.4a Index des formats de fichiers
   

On assiste, avec le développement d'Internet, à un apport de plus en plus grand de composantes multimédia et interactives dans les sites Web. Bien que plusieurs de ces composantes s'intègrent de façon transparente aux pages Web, les utilisateurs d'Internet rencontrent souvent des formats de fichiers qui peuvent nécessiter l'utilisation de logiciels particuliers. Nous avons voulu, dans cette page, donner les informations de base sur les principaux formats de fichiers rencontrés dans Internet. Il s'agit donc d'une introduction seulement, limitée aux fichiers de nature documentaire. L'emphase est mise sur les gratuiciels et partagiciels pour Windows et Macintosh requis pour lire ou décoder ces fichiers.

Les différents formats sont ici regroupés en grandes catégories et ils sont introduits par leur extension de fichier. Cette dernière consiste en trois ou quatres caractères alphanumériques terminant le nom du fichier et précédés d'un point. Par exemple, un fichier dont le nom est menuet.txt possède l'extension de fichier .txt.

Les fichiers d'ordinateurs sont de deux types : ASCII ou binaires. Les premiers sont constitués de caractères qui respectent les codes ASCII. Ceux-ci définissent l'ensemble des caractères typographiques pouvant être reproduits à l'écran d'un ordinateur. En soi, les fichiers ASCII ne contiennent aucun élément de formatage ou de présentation (hormis les sauts de lignes). Ces fichiers ne sont pas limités à contenir du texte. Cependant, on pourra toujours les afficher avec un éditeur, même s'ils ne contiennent que de longues suites de caractères. Quant aux fichiers binaires, ils contiennent des informations codées directement en binaire (des 0 et des 1). Pour afficher ou exécuter un fichier binaire, il faut utiliser un logiciel compatible avec celui qui l'a créé. Il est utile de connaître le type de fichier auquel on a affaire lorsqu'on souhaite le télécharger avec un logiciel FTP. En effet, il est recommandé, avec ces derniers, de spécifier le type approprié avant de procéder au téléchargement.

 

1.4.1 Documents textuels

Il s'agit sans doute de la catégorie de fichiers la moins bien normalisée. Il se dégage tout de même certaines tendances qui permettent aux internautes de s'y retrouver quelque peu.

o .DOC
[Types binaire ou ASCII]. Cette extension de fichier est utilisée pour représenter beaucoup de formats de textes. Le logiciel Microsoft Word, en version Windows, utilise l'extention .doc pour ses fichiers. Ces derniers sont assez répandus dans Internet.
Utiliser : Wordviewer (Windows) ; Logiciels de traitement de texte.
o .HTML .HTM .SHTM .SHTML (Hypertext Markup Language)
[Type ASCII]. Utilisé spécifiquement pour la rédaction de page Web. Il s'agit d'une application de la norme SGML.
Note. Les fichiers se terminant par .SHTM et .SHTML désignent des fichiers qui contiennent des instructions dynamiques de type SSI (Server Side Include). Ces instructions dynamiques pourraient être l'affichage de la date courrante, le nombre de fois que la page a été accédée, ou même une information extraite d'une base de données.
Utiliser : Navigateurs Web.
o .PDF (Portable Document Format)
[Type binaire]. Format du logiciel Acrobat de Adobe. Très répandu pour la diffusion de documents dans Internet.
Utiliser : Acrobat Reader.
o .PPT .PPS (PowerPoint Presentation, PowerPoint Slide Show)
[Type binaire]. Format du logiciel PowerPoint de Microsoft (suite Office), utilisé pour la production de diapositives électroniques généralement projetées sur un écran lors de présentations. Ce logiciel permet aussi de produire des « séances de projection » (slide shows) où les diapositives, qui contiennent souvent des images encapsulées, défilent automatiquement.
Utiliser : Microsoft PowerPoint Viewer.
o .PS .EPS (PostScript)
[Type ASCII]. Également développé par Adobe. Langage de typographie et de mise en page. Utilisé avec des imprimantes laser conçues pour interpréter les codes PostScript.
Utiliser : GostScript ; Envoyer directement à une imprimante laser compatible.
o .RTF (Rich Text Format)
[Type ASCII]. Format de documents textuels normalisé favorisant l'échange entre différents logiciels et plateformes.
Utiliser : Logiciels de traitement de texte.
o .SGML .XML (Standard Generalized Markup Language, Extensible Markup Language)
[Type ASCII]. SGML est une norme internationale pour la représentation de documents textuels en format électronique. Largement utilisé dans l'industrie de l'édition et les bibliothèques numériques pour la production et l'archivage de documents électroniques (périodiques, monographies, etc.). XML est une version « allégée » de SGML. Consulter le site The XML Cover Pages pour de plus amples informations
Utiliser : Navigateur Web : en général, les documents XML et SGML qui sont diffusés dans le Web sont convertis en HTML. Les versions récentes des navigateurs peuvent afficher directement les fichiers XML.
o .TEX
[Type ASCII]. Se prononce comme « tek ». Utilisé pour la rédaction de textes scientifiques. Il faut un compilateur (TeX ou LaTeX) pour générer le document formaté. À la sortie du compilateur, un fichier .dvi (Device Independent) est produit. Ce dernier devra être converti pour l'affichage ou l'impression.
Utiliser : Voir le site de l'American Mathematical Society pour une liste de sources pour gratuiciels et partagiciels de TeX
o .TXT
[Type ASCII]. Par convention, on donne cette extension aux fichiers de texte en simple format ASCII. Documents non formatés.
Utiliser : Navigateurs Web ; Logiciels de traitement de texte ; Éditeurs de texte variés (ex. Bloc-note pour Windows, SimpleText pour Mac).
 

1.4.2 Images

o .GIF (Graphics Interchange Format)
[Type binaire]. Format développé par CompuServe basé sur l'algorithme de compression LZW d'Unisys qui en détient les droits. Fichiers assez compacts mais images limitées à un maximum de 256 couleurs. Utilisé pour produire de petites images peu texturées, des icônes, des boutons dans les pages Web, etc. Permet la transparence et les images animées.
Utiliser : Navigateurs Web
o .JPEG .JPG (Joint Photography Experts Group)
[Type binaire]. Très fréquent dans Internet. Fichiers très compacts grâce à son algorithme de compression efficace mais qui provoque des pertes d'information. Utilisé pour produire des photos et images texturées dans les pages Web.
Utiliser : Navigateurs Web
o .PNG (Portable Network Graphics)
[Type binaire]. Appelé à remplacer les formats GIF et JPEG. Norme publique.
Utiliser : Windows : IrfanView. Mac : SimpleImage
o .TIFF .TIF (Tagged Image File Format)
[Type binaire]. Utilisé pour l'archivage d'images de qualité. Utilise un algorithme de compression sans perte. Fichiers de relativement grandes dimensions.
Utiliser : Windows : IrfanView. Mac : SimpleImage
 

1.4.3 Audio

o .AIFF .AIF (Audio Interchange File Format)
[Type binaire]. Relativement répandu dans Internet.
Utiliser : Netscape, Internet Explorer. Aussi Windows : Lecteur multimédia. Mac : lecteur QuickTime
o .AU
[Type binaire]. Développé pour Unix. Très répandu dans Internet.
Utiliser : Windows : Lecteur multimédia. Mac : lecteur QuickTime
o .MID (Music Instrument Digital Interface)
[Type binaire]. Norme pour transmettre des informations musicales entre instruments électroniques et ordinateurs.
Utiliser : Windows : Lecteur multimédia. Mac : lecteur QuickTime
o .MP3 (Moving Pictures Expert Group)
[Type binaire]. Format public pour la numérisation audio en haute-fidélité (qualité comparable au disque compact).
Utiliser : Windows : Lecteur multimédia. Mac : lecteur QuickTime.
o .RA .RAM (RealAudio)
[Type binaire]. Format propriétaire pour la diffusion en direct de séquences sonores et vidéo par Internet.
Utiliser : RealAudio
o .WAV (Waveform Audio File Format)
[Type binaire]. Format utilisé par Windows pour stocker des séquences sonores.
Utiliser : Windows : Lecteur multimédia. Mac : lecteur QuickTime
 

1.4.4 Vidéo

Il ne faut pas s'attendre à trouver des longs métrages en Dolby stéréo dans Internet (même si, de manière marginale, il est en fait possible d'en trouver). Les réseaux informatiques actuels ne permettent pas des débits de données suffisants. Néanmoins, la vidéo y est bien présente. Il existe deux méthodes de visualisation de séquences vidéo : la méthode en différé et la diffusion en direct. Avec la première méthode, il faut que tout le fichier ait été téléchargé sur son disque dur avant que l'on puisse le visionner. La seconde méthode, au contraire, permet la visualisation pendant le téléchargement. On comprendra que la qualité des séquences en direct sera médiocre. De plus, cette dernière nécessite une connexion très rapide à Internet, sinon les « projections » risquent d'être saccadées. Les séquences vidéo transmises en différé pourront être de meilleure qualité car le temps de téléchargement n'a pas à être synchronisé avec le temps de visualisation. (Selon le débit de la connexion Internet, il faudra peut-être une heure pour télécharger une séquence de quelques minutes.)

Concernant les logiciels de visualisation de vidéos, la plupart de ceux-ci prennent maintenant en charge les formats courants dans le Web. Dans la liste ci-dessous, nous proposons le logiciel « natif », lorsqu'applicable, mais sachez qu'il n'est pas nécessaire d'avoir chacun de ces logiciels pour faire jouer des vidéos de ces différents formats. En général, un seul suffit.

o .AVI (Audio Video Interleave : Video For Windows)
[Type binaire]. Format vidéo générique pour Windows. Généralement visualisation en différé. Ce format peut faire appel à différentes techniques de compression de données grâce à l'utilisation de codec (codeur-décodeur) spécifiques à ces méthodes. (De ce fait, un fichier AVI particulier peut ne pas être lisible si le codec auquel il fait appel n'est pas présent sur son ordinateur.)
Utiliser : Windows : Lecteur multimédia. Mac : lecteur QuickTime
o .MOV .QT (QuickTime Movie)
[Type binaire]. Développé par Apple. Commun sur Internet. Excellente qualité d'image. Généralement visualisation en différé.
Utiliser : QuickTime
o .MPEG .MPG (Moving Pictures Expert Group)
[Type binaire]. Norme publique. Très répandu dans Internet. Généralement visualisation en différé.
Utiliser : Windows : Lecteur multimédia. Mac : lecteur QuickTime
o .RA (RealAudio)
[Type binaire]. Format propriétaire pour la diffusion en direct de séquences sonores et vidéo par Internet.
Utiliser : RealAudio
o .VIV (VivoActive)
[Type binaire]. Format propriétaire pour la diffusion en direct de séquences vidéo par Internet. Qualité d'image médiocre mais fichiers très compacts.
Utiliser : VivoActive Player
 

1.4.5 Compression, archivage et encodage

Ce type de fichier sont d'une très grande utilité pour les usagers d'Internet. La fonction de compression de fichiers consiste à réduire leur taille en applicant un algorithme qui enregistre l'information sous une forme plus compacte. La fonction d'archivage, quant à elle, sert à regrouper plusieurs fichiers dans un même fichier de destination. Les utilitaires d'archivage permettent même de regrouper des répertoires, des sous-répertoires et tout leur contenu sous un même fichier. Généralement, ces deux fonctions de compression et d'archivage se retrouvent simultanément dans la même application. Certains programmes encodent l'information contenu dans des fichiers pour d'autres raisons que les deux fonctions mentionnées précédemment. On retrouve principalement le cryptage des fichiers, pour raison de sécurité et de protection de la vie privée (mais nous n'aborderons pas ce sujet dans la présente introduction) et l'encodage ASCII. C'est ce dernier type d'encodage qui nous intéresse ici. Il consiste à convertir des fichiers binaires en fichiers ASCII pour les rendre transmissibles par courrier électronique ou dans Usenet.

o .ACE
[Type binaire]. Format propriétaire efficace conçu pour archiver et compresser d'énormes fichiers. Il permet le morcellement en fragments, qui sont rassemblés lors de la décompression.
Utiliser : Windows : QuickZip (décompression seulement)
o .BIN
[Type binaire]. Encodage de fichiers pour Macintosh. Format 8 bits.
Utiliser : Mac : StuffIt Expander. Windows : StuffIt Expander.
o .EXE
[Type binaire]. Fichiers exécutables pour DOS ou Windows. Il s'agit de programmes proprement dit. On trouve dans Internet des fichiers de ce type qui sont en fait des archives compressées « auto-extractibles ».
Utiliser : Windows seulement : Exécuter le fichier. Décompression automatique des fichiers contenus dans l'archive.
o .HQX (BinHex)
[Type ASCII]. Encodage ASCII de fichiers binaires. Très commun dans Internet pour les fichiers destinés au Macintosh.
Utiliser : Mac : StuffIt Expander. Windows : StuffIt Expander.
o .GZ .GZIP (GNU ZIP)
[Type binaire]. Compression de fichiers pour la plate-forme UNIX.
Utiliser : Mac : StuffIt Expander. Windows : QuickZip
o .RAR (probablement Roshal Archive, d'après le nom du créateur)
[Type binaire]. Format propriétaire efficace pour l'archivage et la compression de très gros fichiers. Il permet le morcellement en fragments. Ceux-ci sont rassemblés lors de la décompression.
Utiliser : Mac : StuffIt Expander (décompression seulement). Windows : QuickZip (décompression seulement)
o .SIT .SEA (StuffIt archives, self-extracting archives)
[Type binaire]. Archivage de fichiers pour Macintosh, avec compression. Format propriétaire de Alladin Systems. Les fichiers .SEA sont « auto-extractibles ».
Utiliser : Mac : StuffIt Expander. Windows : StuffIt Expander.
o .TAR (Tape archive)
[Type binaire]. Archivage de fichiers pour UNIX, sans compression. Note : dans Internet, les fichiers TAR sont souvent compressés de surcroît. Ils prennent ainsi une extension double : .TAR.Z. Dans ces cas, il faut d'abord décompresser le fichier avant de le désarchiver. Voir .Z.
Utiliser : Mac : StuffIt Expander. Windows : QuickZip
o .UUE (UUencoding)
[Type ASCII]. Encodage ASCII (7 bits) de fichiers binaires. Très commun pour le transfert de fichiers par courrier électronique et dans les forums Usenet.
Utiliser : Mac : StuffIt Expander. Windows : QuickZip. Note. Les clients de courrier électronique et Usenet font souvent le décodage automatiquement.
o .Z (Compress)
[Type binaire]. Compression de UNIX.
Utiliser : Mac : StuffIt Expander. Windows : QuickZip
o .ZIP
[Type binaire]. Format de compression et d'archivage très commun dans Internet, développé pour DOS et Windows.
Utiliser : Mac : StuffIt Expander. Windows : QuickZip
 

1.4.6 Visualisation tridimensionnelle

La visualisation tridimensionnelle et la réalité virtuelle sont maintenant choses relativement courantes dans Internet. Le développement du VRML (Virtual Reality Modeling Language) amène une nouvelle façon d'accéder aux ressources Internet. Bien que cette technologie soit encore à un stade expérimental, on trouve bon nombre d'exemples de mondes virtuels dans lesquels l'internaute peut se déplacer. Pour ce faire, il doit utiliser un navigateur spécialisé, ou encore un module externe (plugin) à ajouter à son navigateur Web.

Dans le domaine de la chimie, il existe plusieurs formats de données pour la représentation de la structure des molécules. Nous indiquons ci-dessous deux formats utilisés couramment dans les banques de données rencontrés dans Internet, tel que PDB SearchLite discuté à la section 3.3.

Réalité virtuelle
o .VRML .WRL .WRZ .VRW (Virtual Reality Modeling Language)
[Type ASCII]. Fichier décrivant des formes tridimensionnelles et des environnements interactifs accessibles par le Web. Il existe deux versions de VRML :1 et 2.
Utiliser : CosmoPlayer (module externe (plugin) pour navigateurs Web. Aussi, pour une liste de navigateurs et modules de visualisation ainsi que des renseignements concernant cette technologie, consultez le VRML Repository.

Chimie
o .PDB (Protein Databank)
[Type ASCII]. Représentation 3D de molécules. Avec un afficheur approprié, on peut observer une molécule sous tous les angles.
Utiliser : MDL Chime, RASMol
o .SPT (RASMol Script File)
[Type ASCII]. Permet d'enregistrer une séquence d'affichage d'une molécule (configuration, angles, rotation, etc.)
Utiliser : MDL Chime, RASMol

1.4.7 Données numériques et statistiques

Nous avons regroupé ci-dessous les principaux formats de fichiers utilisés avec les sytèmes d'information géospatiale (en anglais geographic information systems, ou GIS) ainsi que les formats de diffusion de données statistiques les plus importants.

o .E00
[Type ASCII ou binaire si compressé]. Format d'échange de données pour le sytème d'information géospatiale ARC/Info de Environmental Systems Research Institute, Inc. (ESRI)
Utiliser : ArcExplorer avec Import Utility (Windows seulement).
o .IVT (du nom de la firme Ivation Datasystems)
[Type binaire]. Format propriétaire de la firme canadienne Ivation Datasystems Inc.. Principal format de diffusion de données statistiques dans le cadre de l'Initiative de démocratisation des données (IDD) du gouvernement canadien.
Utiliser : Beyond 20/20 browser (Windows seulement ; on ne peut télécharger le logiciel de ce site).
o .MIF (MapInfo Interchage Format)
[Type ASCII]. Format d'échange de données pour le sytème d'information géospatiale MapInfo. Les fichiers .MIF sont associés à des fichiers de données d'extension .MID.
Utiliser : MapInfo ProViewer (Windows seulement).
o .SAS (à l'origine, Statistical Analysis System)
[Type ASCII]. Initialement développé dans les années soixante-dix, le progiciel de statistiques SAS à évolué en plusieurs produits spécialisés.
Utiliser : SAS System Viewer (Windows seulement).
o .SHP (Shape)
[Type binaire]. Format de données pour le sytème d'information géospatiale ARCview de Environmental Systems Research Institute, Inc. (ESRI). Peut être associée à des fichiers d'extension telle que .shx et .dbf.
Utiliser : ArcExplorer (Windows seulement).
o .SPSS .SPS (Statistical Product and Service Solutions)
Développé à la fin des années soixante sous le nom Statistical Package for the Social Sciences, ce progiciel de statistiques a évolué en divers produits spécialisés.
Utiliser : Liste de logiciels SPSS ; version pour étudiants (Windows seulement)
o .TAB (MapInfo)
[Type ASCII]. Format propriétaire de données pour le sytème d'information géospatiale MapInfo. Le fichier .TAB définit un tableau dans MapInfo. Il est associé à des fichiers binaires d'extensions .DAT, .MAP, .ID ou .IND.
Utiliser : MapInfo ProViewer (Windows seulement).


Page d'accueilTable des matières1- Présentation d'Internet2- Recherche par navigation3- Recherche par interrogationVocabulaire d'Internet, produit par l'OLF Page précédentePage suivante

© 1996 CREPUQ, Tous droits réservés.
Édition du 19 juin 2003
suggestions et commentaires