Nos prestations de test sont souvent comparées aux « Focus group » et autres études proposées par les principaux instituts ou cabinets de conseil qui font intervenir des utilisateurs en groupe.
En qualité de spécialistes en ergonomie dans lévaluation de la qualité de lexpérience utilisateur, nous employons une méthodologie adaptée à lanalyse de lutilisabilité dun service en ligne.
Nous vous proposons ci-dessous lanalyse dune étude à laquelle nous avons assistée qui décrit des problèmes méthodologiques et leurs conséquences sur la qualité de lévaluation réalisée.
Tests en groupe : présentation dun cas pratique
--------------------------
Nous avons récemment assisté à une matinée de test en groupe organisée par un acteur généraliste du conseil : pendant 3 heures, 10 participants ont évalué la maquette html fonctionnelle dun service en ligne.
Deux groupes de cinq participants ont été conviés successivement aux deux phases dévaluation de ce test.
Ils avaient au préalable participé aux groupes de travail préliminaires du projet, dont lobjectif était la définition et la validation des fonctionnalités et contenus mis à disposition dans le service en ligne.
Phase 1 : les participants étaient placés autour dune table et devaient effectuer en une heure, cinq tâches précises en naviguant dans le site. Les tâches étaient définies selon les principales fonctionnalités proposées dans le service en ligne. Chaque participant était assisté par une personne, appelée lobservateur, qui laidait à comprendre la tache et évaluait le succès ou léchec à chacune delles.
Dans cette étude, les observateurs étaient les responsables du projet de service en ligne.
Phase 2 : il sagissait dune séance de travail animée par un consultant. Au cours de cette séance, les participants étaient invités à choisir différents types de graphiques ou de couleurs pour le service en ligne et devaient proposer des solutions permettant de résoudre les difficultés quils avaient rencontrées lors de laccomplissement des tâches qui leur avaient été assignées.
Analyse
--------------------------
Si le nombre dutilisateurs consultés en si peu de temps (et donc à un moindre coût) peut paraître séduisant, la qualité et la pertinence des données recueillies ne nous semble pas permettre dévaluer réellement la qualité de lexpérience des utilisateurs de ce service en ligne.
Les évaluateurs et la méthodologie employée au cours des différentes étapes dune évaluation sont déterminants de la qualité de lanalyse de lutilisabilité du service en ligne.
Or, nous avons identifié, dans cette étude, différents problèmes méthodologiques :
1 - Non objectivité des participants et du mode de passation
-> Recrutement des participants
-> Mode de passation des tests
2 - Non pertinence des données recueillies
-> Qualification des évaluateurs
-> Recueil et analyse des données
3 - Manque de réalisme des sessions de test
-> Construction des scénarios
-> Matériel utilisé
Ces différents points sont présentés dans les paragraphes suivants.
1 - Non objectivité des participants et du mode de passation
--------------------------
a- Recrutement des participants :
Les utilisateurs recrutés avaient déjà participé antérieurement aux focus group au cours desquels les principales fonctionnalités et contenus ont été définis.
Ils connaissaient donc le projet et ses principales caractéristiques, et ne pouvaient donc avoir une vision neutre des informations et services proposés et de larchitecture du site.
-> La connaissance préalable de lobjectif du service en ligne na pas permis lévaluation de sa capacité à répondre aux besoins de ses utilisateurs, plus particulièrement au niveau de la cohérence et de la facilité daccès aux informations présentées.
b- Passation individuelle vs. collective
La situation de test est une situation stressante lorsque lutilisateur ne parvient pas à effectuer la tâche qui lui est demandée. Les participants ont souvent limpression deffectuer un test daptitude, ou se sentent pressés par lobservateur.
Pour le vivre et lavoir observé au quotidien, nous savons que les utilisateurs ont tendance à culpabiliser et à se dévaloriser. Notre présence à leur coté et notre soutien permettent aux utilisateurs de ne pas se culpabiliser en cas déchec dans laccomplissement dune tâche, en leur expliquant quils ne sont pas responsables de cet échec, mais que cest le service en ligne qui ne leur permet pas daccomplir la tâche quils souhaitaient effectuer.
Ainsi, dune part, les utilisateurs ne sont pas stressés et démoralisés de lexpérience quils viennent de vivre, et dautre part, nous recueillons des données franches et sincères.
La passation collective génère un stress supplémentaire : la comparaison inter-individuelle : « pourquoi lui y arrive et pas moi ».
-> Ce type de passation nest bonne ni en terme de données recueillies ni en terme de confort des utilisateurs.
2 - Non compétence des évaluateurs
---------------------------------
La qualité de lanalyse de lutilisabilité dun service en ligne est très largement liée à la méthodologie de recueil et de traitement des données mises en uvre.
Celle-ci est dépendante :
- de la qualification des évaluateurs qui élaborent et emploient cette méthodologie au long des différentes phase de lévaluation du service en ligne
- de la pertinence du recueil et de lanalyse des données.
a - Qualification des évaluateurs
Seuls des experts de lInteraction Homme/ Machine peuvent évaluer lutilisabilité dun site, cest à dire la capacité de ce service en ligne à être facilement compris et utilisable par ses clients et prospects.
Il appartient bien à des psychologues cogniticiens formés à lanalyse fonctionnelle des systèmes informatiques plutôt quà des spécialistes du marketing et de la sémiologie, de répondre et dévaluer la qualité de lexpérience utilisateur dun service en ligne.
Enfin, lexpertise dans la conduite de lévaluation (facilitation du test et entretien) permet ne pas influencer ou induire des réponses spécifiques des utilisateurs.
Analyse :
Les observateurs étaient les responsables du projet, et ils ne voyait chacun quun seul utilisateur. Les données recueillies étaient ainsi liées aux différents observateurs, ceux-ci ne sétant pas coordonnés auparavant.
Or, pour avoir un recueil de données homogène et une vision transversale des difficultés rencontrées par les utilisateurs, il est important que tous les participants soient évaluées par la(es) même(s) personne(s).
-> Il en résulte :
- un manque dhomogénéité des données qui pénalisera la qualité de lanalyse, et
- une absence de vision densemble du comportement des utilisateurs de ce service en ligne.
b - Recueil et analyse des données
La connaissance de linterface web et du fonctionnement humain permettent de focaliser le recueil sur des données issues de lobservation du comportement et des verbalisations des participants.
La connaissance du fonctionnement cognitif de lHomme, de ses caractéristiques et limites, permet doptimiser le recueil des données issues de lobservation de linteraction entre un utilisateur et un service en ligne, tant au niveau de la pertinence des données recueillies quau niveau de la qualité de ce recueil.
Les verbalisations ne permettent pas seules de rendre compte de lensemble de lexpérience utilisateur.
Par exemple, les informations traitées de manière « automatique », sans sen rendre compte, sont difficilement verbalisables (e.g. qui est capable de décrire sans oubli et sans erreur les différentes opérations à effectuer pour démarrer une voiture, alors que la plupart dentre nous le faisons automatiquement ?).
De plus, la capacité et les stratégies de mémorisation ne permettent pas de retracer de manière fiable et complète lensemble des actions effectuées pour compléter une tache.
Quant aux données comportementales recueillies, elles doivent concerner essentiellement les interactions des utilisateurs avec les éléments de linterface supportant les principales fonctions cognitives.
Lanalyse de ces données est ensuite orientée vers lidentification et la compréhension des éléments et évènements perturbateurs qui pénalisent lexpérience de lutilisateur du service en ligne.
Analyse :
Les observateurs posaient des questions assez vagues sur des aspects superficiels de linterface (couleur, style, graphisme) ce qui ne permet pas de recueillir des informations sur les problèmes dutilisation de linterface rencontrés par les utilisateurs.
De même, lattention des observateurs était portée essentiellement sur les verbalisations de lutilisateur et non sur ses actes.
Les données recueillies risquent alors de refléter :
- ce que lutilisateur aimerait entendre
ou ce quil pense que lon voudrait entendre de lui
- ce dont il se souvient avoir fait
(mais il ne souvient pas toujours ce quil a fait)
- ce quil pense avoir fait
et non sur ce quil a réellement fait.
-> Ainsi, lidentification des difficultés et des stratégies réelles dutilisation du service en ligne nécessitent la mise en uvre dune méthodologie de recueil et danalyse de données prenant en compte le comportement et les verbalisations des utilisateurs.
La mise en uvre dune méthodologie adaptée à lévaluation de lexpérience utilisateur nécessite la connaissance :
- du fonctionnement habituel dun utilisateur lors dune tâche de résolution de problème (par exemple recherche dinformation),
- de linterface web et de ses éléments déterminants tant au niveau de leur signification que de leur utilisation, et,
- du fonctionnement cognitif humain.
3 - Manque de réalisme des sessions de test
--------------------------
La méthodologie dévaluation doit permettre de reproduire le comportement le plus naturel possible, tant au niveau du réalisme des scénarios quau niveau du matériel utilisé afin de recueillir des données les plus réalistes possibles.
a- Construction des scénarios
Le comportement des utilisateurs est différent lorsque la mission quils doivent accomplir nest pas celle quils se sont fixés eux-mêmes : les données recueillies peuvent alors refléter un comportement artificiel parfois très différent du comportement réel.
De même, lordre de présentation des différents éléments et le temps passé sur les différentes pages du site doivent refléter le plus possible une navigation « naturelle ».
Analyse :
les scénarios et tâches données aux participants étaient préalablement définies et ne prenaient pas en compte leurs attentes. Ils sont restés très longtemps sur la page daccueil, car de nombreuses questions y faisaient référence, alors quen réalité, les utilisateurs ny passent pas plus de 15-20 secondes avant de cliquer sur un lien.
-> La navigation naturelle doit être privilégiée : le fait quun utilisateur neffectue pas de commentaires ou nutilise pas certains éléments du site, est un résultat en soi : lutilisateur ne la pas vu ou nen a pas eu besoin pour laccomplissement de sa mission.
b -Matériel utilisé
Le matériel utilisé doit refléter le matériel réel des utilisateurs finaux du service en ligne.
Analyse :
Les divers ordinateurs mis à la disposition des utilisateurs ne correspondaient pas à léquipement moyen de la cible visée (ordinateur portable, sans souris, petit clavier, écran réglé en 1024 pixels, connectés au réseau interne de lentreprise).
Conclusion
------------------------------
Ainsi, lévaluation dun service en ligne doit être effectuée par des spécialistes du domaine, et selon une méthodologie rodée et pertinente pour les données à recueillir.
Au final, tout le monde risque dêtre pénalisé :
- lutilisateur final ne sera pas satisfait par le produit réalisé,
- le propriétaire du service en ligne ne rentabilisera pas son investissement,
- le prestataire du test ne renouvellera pas sa prestation.
|