Règles et conseils pour la conception de visualisation de données

Cours 2 - 2025-2026

September 9, 2025

Plan


  • Perception visuelle
  • Théorie de la Gestalt
  • La sémiologie graphique de Jacques Bertin (et ses successeurs)
  • Conseils pour la conception de visualisation de données


Source : Four color theorem, Carlos ZGZ, public domain licence.

Perception visuelle


  • On ne peut se rappeler que de 4 à 7 éléments d’information à la fois dans notre mémoire à court terme.


  • On peut utiliser différents mécanismes de la perception visuelle, lors de la réalisation de visualisation de données, pour aider nos cerveaux à interpréter l’information avant que notre cerveau n’engage sa mémoire à court terme.

Traitement visuel pré-attentif


  • Le traitement visuel pré-attentif est un traitement visuel qui se produit avant l’attention consciente.

  • Il permet de détecter des caractéristiques visuelles telles que la couleur, la forme, la taille, etc.

Traitement visuel pré-attentif


Par exemple dans le cadre d’un rapport présentant les données d’exportation de la France, par rapport à ses voisins, en 2019 :


vs.

Traitement visuel pré-attentif

pré-attentif

attentif

Traitement visuel pré-attentif

  • Combien y a-t-il de 6 sur cette image ?

2869408609876

9348586748676

2967303986739

3967496749674

Traitement visuel pré-attentif

  • Combien y a-t-il de 6 sur cette image ?

2869408609876

9348586748676

2967303986739

3967496749674

Traitement visuel pré-attentif

  • Combien y a-t-il de 6 sur cette image ?

2869408609876

9348586748676

2967303986739

3967496749674

Traitement visuel pré-attentif

  • Combien y a-t-il de 6 sur cette image ?

2869408609876

9348586748676

2967303986739

3967496749674

Traitement visuel pré-attentif

  • Combien y a-t-il de 6 sur cette image ?

2869408609876

9348586748676

2967303986739

3967496749674

Propriétés pré-attentives

  • Les propriétés pré-attentives sont les caractéristiques des éléments visuels qui peuvent être détectées pré-attentivement.

  • On peut les classer en 4 catégories :

    • couleur (teinte, saturation, luminosité).
    • forme (taille, orientation, forme)
    • mouvement (scintillement, vitesse, direction)
    • position (x, y, concavité / convexité)
  • Ces attributs pré-attentifs illustrent comment les éléments peuvent être mis en évidence dans une visualisation de données.

Théorie de la Gestalt

  • Une théorie de la perception qui s’intéresse à la manière dont les êtres humains perçoivent les objets.

  • Développée par des psychologues allemands au début du XXe siècle.

  • La théorie de la Gestalt est utilisée en design, en psychologie, en ergonomie, en informatique, etc. … et en visualisation de données.

Les principales lois de la Gestalt


  • La loi de la proximité - L’esprit imagine naturellement une relation entre 2 objet proche l’un de l’autre
  • La loi de la similarité - Lorsque 2 objets se ressemblent, l’esprit tend à les percevoir comme un groupe
  • La loi de la continuité - L’oeil suit naturellement une ligne ou une courbe
  • La loi de la cloture (ou de la fermeture) - L’esprit clôt une forme incomplète ou un espace non fermé
  • La loi de la symétrie - L’oeil associe 2 objets symétriques comme un même groupe unifié
  • La loi de la destination commune - L’oeil associe des objets qui se dirigent vers un même point
  • La loi de la figure et du fond - L’esprit sépare naturellement un objet de son fond

Les principales lois de la Gestalt

Pour résumer…

La sémiologie graphique de Jacques Bertin


  • Jacques Bertin (1918-2010) est un cartographe et théoricien de la sémiologie graphique.

  • Il a développé une théorie de la visualisation de données dans son ouvrage “Sémiologie graphique” (1967).

  • Il a notamment défini les variables rétiniennes (ou variables visuelles) et leurs propriétés.

Les variables visuelles

  • Les variables visuelles sont les propriétés des objets visuels qui peuvent être utilisées pour encoder les données.

  • Les variables visuelles sont au nombre de 7 :

    • position
    • taille
    • couleur
    • forme
    • orientation
    • texture
    • valeur

Les propriétés des variables visuelles

  • Les propriétés des variables visuelles sont les caractéristiques des variables visuelles qui permettent de les distinguer les unes des autres.

  • Les propriétés des variables visuelles sont au nombre de 4 :

    • association - les signaux sont perçus comme appartenant à un même groupe
    • sélection - les signaux sont perçus comme différents et forment des familles
    • ordre - les signaux sont perçus comme étant ordonnés
    • proportion (ou différence quantitative) - les signaux sont perçus comme étant proportionnels entre eux / à la valeur qu’ils représentent

Les variables visuelles et leurs propriétés


Les variables visuelles et leurs propriétés


Les variables visuelles et leurs propriétés


Les successeurs de Jacques Bertin : Cleveland & McGill, Mackinlay, etc.


  • Depuis les travaux de Jacques Bertin, d’autres chercheurs ont proposé des typologies de variables visuelles et de leurs propriétés.

 


Conseils pratiques pour parvenir à une visualisation de données pertinente

Choisir une forme de graphique adapté

Cf. le cours d’introduction et les exercices en TP

Différentes ressources peuvent aider à choisir le bon type de graphique :

Expressivité, efficacité et pertinence

  • Une visualisation est considérée comme expressive si les informations pertinentes d’un ensemble de données (et uniquement celles-ci) sont exprimées par la visualisation. Le terme “pertinent” implique que l’expressivité d’une visualisation ne peut être évaluée qu’en fonction d’un utilisateur particulier travaillant avec la représentation visuelle pour atteindre certains objectifs.

“Une visualisation est dite expressive si et seulement si elle encode toutes les relations de données prévues et aucune autre relation de données” - Stuart Card, 2008

  • Une visualisation est efficace si elle tient compte des capacités du système visuel humain. Étant donné que la perception, et donc l’image mentale d’une représentation visuelle, varie d’un utilisateur à l’autre, l’efficacité dépend de l’utilisateur. Néanmoins, certaines règles générales pour une visualisation efficace ont été établies dans la communauté de la visualisation.

“Les critères d’efficacité permettent de déterminer lequel de ces langages graphiques [qui sont expressifs], dans une situation donnée, est le plus efficace pour exploiter les capacités du support de sortie et du système visuel humain. - Mackinlay, 1986

  • La pertinence concerne le compromis entre les efforts requis pour créer la représentation visuelle et les avantages qu’elle procure. Si ce compromis est équilibré, la visualisation est considérée comme appropriée.

Clareté et simplicité

  • Les visualisations de données doivent être simples à comprendre : de manière générale, il faudra essayer de choisir la manière la plus simple de transmettre l’information.

  • Éviter les éléments visuels complexes et inutiles qui pourraient distraire de l’objectif principal de la visualisation (3D, effets spéciaux, etc.).

Transmettre un message précis


  • Déterminez les relations entre les données et ce que vous voulez montrer en présence de vos données.


  • Concentrez-vous sur ce que vous voulez illustrer et sur le message à transmettre à l’aide de votre visualisation de données.

Désencombrement


  • L’ennemi de la clareté est le désordre !


  • Chaque élément visuel d’un graphique ajoute une charge cognitive (i.e. un effort mental nécessaire à traiter l’information)

  • Identifiez ce qui n’apporte pas de valeur ajoutée à votre visualisation et supprimez-le.

Désencombrement

  • Selon Tufte, “plus la part d’encre d’un graphique consacrée aux données est importante, mieux c’est” (maximisation du “data-ink ratio”).
  • D’autres auteurs parlent de “maximiser le rapport signal/bruit”, le signal étant l’information que nous voulons communiquer.

Désencombrement

Par ailleurs :

  • Utilisez une police, une taille de police, une couleur et un alignement uniformes.

  • Utilisez des espaces blancs :

    • présence de marges (libres de tout élément visuel)
    • ne pas étirer les graphiques jusqu’au bord de la page (ou trop près des autres éléments visuels)
    • considérez l’espace blanc comme une bordure autour de votre graphique

Titre, description, source, légende, axes, etc.

Il est nécessaire :

  • d’expliquer l’encodage des données (via des légendes ou des annotations) et d’inclure les unités de mesure
  • d’étiqueter les axes
  • de mettre une légende (le cas échéant)
  • d’expliquer le contexte de la visualisation (via un titre, une description, etc.)
  • de citer la source des données (pour permettre de reproduire la visualisation, pour permettre aux lecteurs de vérifier les informations, etc.)

Titre, description, source, légende, axes, etc.



Le principe de la proportionnalité et la coupure de l’axe Y

  • The principle of proportional ink (Bergstrom and West, 2016)

Le principe de la proportionnalité et la coupure de l’axe Y (ou X !)

Source : https://twitter.com/Motorsport/status/1432668101905195013/photo/1




Source : https://observablehq.com/@kenklin/shortest-f1-races-by-distance


Le principe de la proportionnalité et la coupure de l’axe Y


  • Ça reste un débat ouvert : E. Tufte pense que la coupure de l’axe Y (origine à une autre valeur que 0) peut être pertinente pour des séries temporelles…

“In general, in a time-series, use a baseline that shows the data not the zero point” - Edward Tufte

Le principe de la proportionnalité et la coupure de l’axe Y

  • D’autres auteurs (Wilke, 2019) le déconseillent fortement, même pour des séries temporelles, et conseillent l’utilisation éventuelle d’autres représentation (différence par rapport à une valeur de référence, etc.)

Alternative :

Le principe de la proportionnalité

  • L’oeil humain est très sensible aux différences de longueur, mais moins aux différences de surface.
  • Le diagramme en secteurs (camembert) comporte un double problème : ce sont les angles qui sont comparés, et non les surfaces, et il est d’autant plus difficile de comparer les angles entre eux.

Vérifier les données

  • Valeurs aberrantes
  • Pics
  • Anomalies

… et les corriger si nécessaire (suppression de valeurs aberrantes, etc.).

Tri des données

  • Trier les données à afficher sur les axes pour faciliter la lecture.

Tri des données



Tri des données

Hiérarchiser l’information


  • Utiliser la taille, la couleur et la position pour indiquer l’importance et la relation entre les éléments.


  • Les éléments plus importants doivent être plus visibles.

Choix des couleurs


  • Attention à la signification des couleurs dans différentes cultures.


  • Attention à la signification des couleurs dans différents contextes.

Palettes de couleurs

  • Catégorielle (categorical)
  • Séquentielle (sequential)
  • Divergente (diverging)

Palettes de couleurs

- Attention aux personnes présentant des difficultés visuelles (daltonisme, etc.) : utilisez des palettes de couleurs adaptées.

Source : https://towardsdatascience.com/is-your-color-palette-stopping-you-from-reaching-your-goals-bf3b32d2ac49

Palettes de couleurs

  • Évitez les palettes de couleurs qui pourraient être confuses…
    (+ évitez les différents autres problèmes de la carte de droite !)

Palettes de couleurs

  • Utilisez de manière préférentielle des palettes existantes (celles fournis par D3.js, etc.) pour éviter les erreurs.

  • En JavaScript :

  • Pour manipuler les couleurs en JavaScript :

Contraste et lisibilité

  • Assurez-vous que les couleurs utilisées offrent un contraste suffisant pour permettre une lecture facile, même pour les personnes ayant des difficultés visuelles.

Difficile de lire les valeurs…

Meilleure lisibilité :

Contraste et lisibilité

  • Assurez-vous que les couleurs utilisées offrent un contraste suffisant pour permettre une lecture facile, même pour les personnes ayant des difficultés visuelles.

Processus itératif

  • Prenez le temps nécessaire à configurer, modifier, tester, corriger, etc. votre visualisation de données : il s’agit d’un processus itératif.

  • Demandez des retours à vos collègues, à vos amis, etc.

Source : https://www.e-education.psu.edu/geog586/node/808 - Credit: Blanford, © Penn State University, licensed under CC BY-NC-SA 4.0

Processus itératif


  • Pensez à utiliser un gestionnaire de versions de code (Git, etc.) pour pouvoir revenir en arrière et travailler en équipe si nécessaire (sur la plateforme Observable il est possible de travailler à plusieurs sur un notebook et le code des notebooks est automatiquement versionné et il est ainsi possible de revenir à une version précédente).

Trouver des modèles inspirants


  • Pour réaliser des visualisations de données efficaces, il est important de s’inspirer de modèles existants.
  • Cf. les différentes ressources sur la page d’acceuil de ce cours.

… et éviter les erreurs classiques


Une partie des erreurs classiques sont résumées dans ce cours. D’autres peuvent être consultées sur la page suivante :

Une autre tentative de résumer des règles de base (et de quand il est OK de passer outre) est disponible sur la page suivante :

Si vous voulez vous faire peur, vous pouvez aussi consulter la page suivante dédiée aux visualisation de données ratées :

 


À vous de jouer !