© Uwe Hentschel

Luis Leiva démontre comment les mouvements de la souris d'ordinateur peuvent être capturés mais également manipulés.

Luis Leiva l’illustre par un exemple très simple : « Supposons que nous recherchons sur Google l’âge d’un acteur et que nous obtenons la page des résultats avec les liens correspondants. Si nous ne cliquons ensuite sur aucun de ces liens, cela peut signifier, par exemple, que nous ne sommes plus intéressés par une recherche plus approfondie ou alors que nous avons déjà trouvé les informations nécessaires sur la page affichant les résultats de recherche. »

Dans ce cas, l’opérateur du moteur de recherche ne saurait pas pourquoi on a quitté la page. C’est en tout cas ce que l’on pourrait penser, s’il n’y avait pas l’histoire de la souris. Car son déplacement révèle parfois plus de choses sur nous, les utilisateurs, que nous ne le savons et, peut-être, qu’il ne nous convient.

Des informations peuvent être collectées avec seulement cinq lignes de code

« Nous avons démontré à quel point il est facile de collecter des données à grande échelle sur le comportement des utilisateurs en suivant discrètement les mouvements de leur souris et en prédisant les informations démographiques de l’utilisateur avec une précision raisonnable et à l’aide de seulement cinq lignes de code », explique le chercheur de l’Université du Luxembourg.

S’il est possible depuis longtemps d’enregistrer les mouvements de la souris sans aucun problème, les analyser nécessitait jusqu’à présent des connaissances avancées en informatique et en apprentissage automatique. Aujourd’hui, il existe toutefois de nombreuses plateformes logicielles qui permettent à tout utilisateur ayant un minimum de connaissances en programmation de créer des algorithmes sophistiqués, explique M. Leiva.

Ce qui peut être analysé à partir du mouvement de la souris (en combinaison avec le contenu du site Web), ce sont des informations telles que l’âge de l’utilisateur. « Les mouvements des utilisateurs plus âgés ont tendance à être plus indécis et plus lents que ceux des jeunes utilisateurs », explique-t-il. En ce qui concerne le sexe de l’utilisateur, en revanche, les prédictions ne sont pas toujours parfaites. « Mais je suis sûr que cela peut encore être amélioré », affirme l’informaticien. Et cela, selon lui, soulève sans aucun doute de nouvelles questions concernant la protection des données. Enfin, les utilisateurs n’auraient actuellement pas la possibilité d’empêcher l’analyse des mouvements de leur souris par un simple mécanisme d’exclusion, c’est-à-dire en émettant une objection.


Une extension de navigateur Web empêche les suivis non souhaités

Le professeur en informatique s’est donc attaqué au problème avec des collègues chercheurs dans le cadre de deux projets de recherche. D’une part, une méthode a été développée pour protéger les utilisateurs contre le suivi indésirable des mouvements de leur souris. L’équipe a conçu à cette fin une extension de navigateur Web appelée MouseFaker.

À l’aide de l’application, qui est disponible sur GitHub, les coordonnées de la souris sont déformées en temps réel. Le parcours réel de la souris n’est donc pas reconnaissable, un mouvement généré artificiellement s’y superposant. Il est certes tout à fait possible pour des experts en informatique de contourner la fonction, admet le chercheur. « Jusqu’à présent, cependant, nous avons analysé les systèmes de suivi les plus courants qui sont utilisés dans le commerce et aucun d’entre eux n’a été capable de filtrer ces mouvements artificiels. »

Le parcours réel de la souris (en haut) est superposé par un mouvement généré artificiellement (en bas)

Problématique au regard de la législation sur la protection des données, mais également utile

Étant donné que le suivi de la souris pose des problèmes de protection des données, mais qu’il peut aussi être utile puisqu’il peut être utilisé pour optimiser les moteurs de recherche, les chercheurs ont examiné dans le deuxième projet dans quelle mesure il suffit d’enregistrer seulement de courtes séquences à partir de l’ensemble des mouvements. M. Leiva et ses collègues ont voulu savoir s’il était encore possible de tirer des conclusions sur la façon dont les gens prennent des décisions lors de recherches en ligne. À cette fin, l’équipe a analysé trois scénarios représentatifs dans lesquels les utilisatrices et utilisateurs devaient prendre une décision en effectuant une recherche sur Internet : 1. lorsqu’ils remarquent une publicité, 2. lorsqu’ils quittent la page et 3. lorsqu’ils sont frustrés.

Les résultats ont montré qu’il existe des différences notables. De cette façon, les premiers mouvements de la souris signalent déjà que l’utilisateur prête attention à une publicité. Lorsque l’on quitte une page, en revanche, c’est l’inverse. Dans ce cas, seuls les derniers mouvements permettent de savoir si l’utilisateur a décidé de quitter la page et s’il était satisfait des résultats de la recherche sans avoir eu à cliquer sur quoi que ce soit. Dans le cas de la frustration, les résultats étaient mitigés, mais des indices ont montré que la partie médiane de la courbe de mouvement de la souris fournissait plus d’informations que le début ou la fin.

Les informations requises peuvent être collectées en quelques secondes

Les chercheurs ont découvert qu’il est parfois possible de prédire les tâches susmentionnées à partir d’un mouvement de souris ne durant que deux à trois secondes. « Les moteurs de recherche peuvent donc générer des informations utiles et améliorer leurs services même s’ils ne suivent que les parties pertinentes », résume le chercheur de l’Université du Luxembourg. La vie privée des utilisateurs serait ainsi mieux protégée. « En fin de compte », explique M. Leiva, « en enregistrant efficacement la bonne quantité de données de mouvement, nous pouvons économiser une bande passante et un espace de stockage précieux, protéger la vie privée des utilisateurs et augmenter la vitesse à laquelle les modèles d’apprentissage automatique peuvent être conçus et déployés. »

Même s’il fait lui-même des recherches dans ce domaine depuis de nombreuses années, cela n’a que très peu d’influence sur son propre comportement face à la souris. « Si mes mouvements sur le site Web peuvent contribuer à me fournir un meilleur service, alors cela me convient », déclare l’informaticien. « Mais je comprends très bien que les gens soient contrariés par le fait que les mouvements de leur souris soient enregistrés à leur insu. »

Auteur : Uwe Hentschel
Photo : Uwe Hentschel

Illustrations : University of Luxembourg

Infobox

Publications

L. A. Leiva, I. Arapakais, C. Iordanou. My Mouse, My Rules: Privacy Issues of Behavioral User Profiling via Mouse Tracking, Proceedings of ACM SIGIR Conference on Human Information Interaction and Retrieval, DOI: 10.1145/3406522.3446011

L. Brückner, I. Arapakis, L. A. Leiva. When Choice HappensA Systematic Examination of Mouse Movement Length for Decision Making in Web Search, Proceedings of the International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), DOI: 10.1145/3404835.3463055

Aussi intéréssant

SnT Partnership Day Une interface éprouvée entre la recherche et l’application

Le SnT de l’Université fait désormais partie des centres de recherche les plus importants au monde en matière de dévelop...

SnT
Le système de sécurité des aéroports de haute technologie FLYSEC La fin des longues files d’attente et des mesures de sécurité contraignantes

L’Université du Luxembourg, en collaboration avec Lux-Airport, a testé un système de sécurité des aéroports de haute tec...

Aussi dans cette rubrique

Ether coin
Lacune dans la blockchain Cryptomonnaie : Des pratiques frauduleuses révélées par des chercheurs au Luxembourg

Une escroquerie dans la blockchain de la cryptomonnaie Ether a été détectée par un doctorant de l’Université du Luxembourg

FNR Awards 2020 Pour un meilleur contrôle qualité de tests pour des logiciels informatiques

Thierry Titcheu Chekam a remporté un prix pour sa thèse de doctorat, qu’il a accompli au centre de recherche interdisciplinaire SnT de l'Université du Luxembourg.

Highly Cited Researchers Le travail multidisciplinaire de Stéphane Bordas, cité encore et toujours

Les travaux de certains scientifiques sont très souvent cités dans les publications. Stéphane Bordas, Professeur d'université, se retrouve dans cette catégorie.

FNR Awards 2019 Pour l'optimisation de l'utilisation du spectre radioélectrique entre les systèmes de communication par satellite et terrestre

Des chercheurs de l'Université du Luxembourg proposent une idée pour utiliser le spectre de fréquences radioélectriques disponibles sous licence de manière plus efficace.