Aller au contenu

Le format csv

csv

Les lettres csv signifient comma separated values, c'est-à-dire valeurs séparées par des virgules.

Exemple de fichier csv

On peut télécharger des données au format csv par exemple sur le site de l'INSEE.

Par exemple, à cette adresse, vous pouvez télécharger ce fichier csv portant sur l'espérance de vie des femmes en France.

  • Ouvrir ce fichier avec un simple éditeur de texte. Quel est le séparateur de données utilisé?
  • Puis ouvrir le même fichier avec un tableur.
Séparateur

On constate que le séparateur de données utilisé n'est pas la virgule mais le point virgule. Dans un fichier csv français c'est souvent le cas puisqu'on réserve traditionnellement la virgule à un rôle de séparateur décimal.

Le séparateur étant le point-virgule, on fera attention à bien sélectionner le point-virgule comme séparateur à l'ouverture avec LibreOffice.

  • Ouvrir à nouveau le fichier avec un éditeur (geany par exemple), remplacer les "." utilisés comme séparateur décimal par des virgules (utiliser le menu Rechercher/Remplacer). Ajouter également une donnée dans une nouvelle cellule sur la droite où vous entrerez simplement un nombre tel que 89,65. Puis ouvrir ce fichier modifié en choisissant virgule et point-virgule comme séparateur de données. Que constate-t-on ? A votre avis, pourquoi?
Séparateur virgule

le fichier csv modifié
89 et 65 (entrés dans la cellule supplémentaire) sont normalement bien séparés comme s'il s'agissait de deux données distinctes. Les autres données ne le sont pas car elles sont encapsulées dans des " " qui en font une unité et permettent d'annuler le rôle de séparateur de la virgule.

Note

Lorsqu'on ouvre un fichier csv avec un tableur, en sélectionnant la virgule comme séparateur de données, on constate que les données qui sont les unes en-dessous des autres dans le fichier texte initial constituent les données d'une même colonne dans le tableur.

De même les données qui sont sur une même ligne du fichier texte, séparées par une virgule, sont sur une même ligne du fichier tableur.

Des séparateurs

Par défaut, la virgule est le séparateur de données. Mais il est également possible de choisir la tabulation (par exemple) comme séparateur de données. Ou encore le point-virgule (notamment pour des données statistiques écrites avec la virgule comme séparateur décimal, comme c'est l'usage en France).

Exercice

  • Ouvrir LibreOffice Calc et remplir quelques lignes et colonnes. Par exemple ainsi.
  • Enregistrer le au format ods (format LibreOffice Calc).
  • Puis fichier/enregistrer sous/ texte csv. Choisir la virgule comme séparateur.
  • Ouvrir ensuite le fichier csv ainsi créé avec un simple éditeur de texte (par exemple geany) et observer comment vos données en colonne sont enregistrées.
  • Recommencer en créant un second fichier ods puis enregistrer le au format csv mais en choisissant le point-virgule comme séparateur. Observer ensuite le contenu du fichier csv en l'ouvrant avec un simple éditeur de texte.
  • Vous pouvez recommencer en choisissant maintenant la tabulation comme séparateur.