Version PDF

Société

20 fév 2021

Utilisation des données des réseaux sociaux pour mieux appréhender la détresse liée au diabète des patients

Charline BOUR* et Guy FAGHERAZZI**

Les réseaux sociaux sont des plateformes qui facilitent le partage d’idées, de pensées et d’informations grâce à la création de réseaux virtuels et de communautés. Depuis leur création en 2005, les réseaux sociaux ne cessent de se développer et regroupent plus de 3,8 milliards d’utilisateurs actifs en 2020. En parallèle de cette croissance, l’infodémiologie (mot-valise formé d’information et épidémiologie(1)), discipline basée sur des supports d’informations, en particulier Internet, visant à surveiller l’état de santé des populations et à orienter les politiques de santé publique, a émergé. Les chercheurs se sont donc penchés sur ces plateformes et les approches de recherche traditionnelle y ont été adaptées.

Le recrutement de populations ciblées ou difficiles à atteindre (p. ex. : jeunes, personnes isolées) a prouvé être efficace, rapide et à moindre coût, notamment sur Facebook(2-4). De plus, au vu du nombre élevé de publications sur les réseaux sociaux lors d’événements d’urgence, tels que les pics d’activité épidémiques ou les catastrophes naturelles, les réseaux sociaux peuvent être particulièrement utiles pour l’étude des maladies infectieuses(5,6). Il est également possible de développer la pharmacovigilance sur les réseaux sociaux afin de détecter et identifier des effets secondaires ou indésirables(7,8). Plus globalement, les utilisateurs génèrent un nombre important de données, ce qui constitue une partie considérable du digitosome (ensemble des données générées en ligne par un individu au cours de sa vie(9)). En 2010 aux États-Unis, 11 % des utilisateurs de réseaux sociaux ont publié du contenu médical(10), qui est potentiellement exploitable pour la recherche en santé publique afin d’étudier et de mieux comprendre le ressenti des populations. Le cas du diabète Le projet World Distress Diabetes Studies (WDDS), porté par le Luxembourg Institute of Health vise à mieux décrire la détresse liée au diabète et ses déterminants partout dans le monde. L’utilisation d’intelligence artificielle pour étudier des données extraites de réseaux sociaux, en particulier Twitter, s’inscrit dans ce projet(9). Twitter est un réseau social comportant près de 145 millions d’utilisateurs journaliers et sur lequel il est possible de poster de courts messages appelés « tweets ». Près de 500 millions de tweets étaient publiés par jour en 2020(11). Par défaut, les paramètres d’un compte sont publics, ce qui permet alors aux chercheurs d’accéder rapidement à un grand nombre de tweets et aux métadonnées associées. On peut notamment y retrouver une communauté du diabète (DOC : Diabetes Online Community) qui partage son ressenti, son anxiété et ses problèmes du quotidien liés à la maladie. Ces données peuvent alors être étudiées afin de mieux comprendre la détresse liée au diabète. La détresse liée au diabète est définie par le stress, les craintes ou encore les émotions liées à la gestion du diabète au quotidien, que ce soit par rapport au traitement, à la maladie en elle-même ou encore aux médicaments. Elle touche entre 25 % et 60 % des patients à un moment donné de leur maladie. Elle peut donc être considérée comme le facteur de santé psychosocial le plus important dans la gestion d’un diabète. Elle est plus fréquente dans le diabète de type 1 que le type 2, mais peut toucher toutes les formes de diabète, quel que soit le nombre d’années dans la maladie ou la valeur de l’HbA1c. Pourtant, les échelles actuelles d’évaluation de cette détresse sont incomplètes : elles n’intègrent pas toutes les dimensions de la détresse, sont non évolutives et sujettes à des biais. Cette communauté du diabète en ligne, très active dans le monde entier, qui partage régulièrement ce qu’elle ressent et comment elle se comporte face à sa maladie, est donc une occasion de collecter et d’analyser des données précieuses et complémentaires de ce qui peut être collecté dans un cadre clinique traditionnel. Quelques résultats Twitter met à disposition une API (Application Programming Interface) qui permet de collecter les tweets, notamment en fonction de mots-clés. Les tweets liés au diabète peuvent être retrouvés, par exemple, avec des mots-clés ou « hashtags » tels que « #t1d » (type 1 diabetes) ou #t2d (type 2 diabetes). Les données ainsi collectées contiennent non seulement le tweet de l’utilisateur, mais également les métadonnées de celui-ci. La provenance de ces tweets est ensuite identifiable et permet des analyses géographiques ciblées à l’échelle d’un pays, d’une région ou d’une ville. Ces analyses dites de Big Data ont l’avantage de capter des signaux faibles, c’est-à-dire des événements peu répandus ou des données provenant de pays ayant un faible nombre d’utilisateurs de réseaux sociaux. Il est fondamental de noter que, bien que toutes ces données soient considérées comme publiques, leur traitement ou leur partage soulèvent des questions éthiques et légales, et qu’il est crucial de les analyser selon les bonnes pratiques cliniques et épidémiologiques usuelles afin de préserver la sécurité des individus(12,13). La collecte de tweets liés au diabète, s’inscrivant dans le projet WDDS, a été lancée depuis mai 2017, sur la base d’une liste de mots-clés et de hashtags liés au diabète en anglais, espagnol et français. Cette collecte représente près de 85 000 tweets par semaine, soit aujourd’hui la constitution d’une base de données mondiale de plus de 20 millions de tweets liés au diabète. Le but de cette étude est, entre autres, de mettre en correspondance les tweets contenant des données de géolocalisation avec les bases de données ouvertes existantes pour identifier les déterminants socio-démographiques, socio-économiques et environnementaux associés aux schémas de détresse liée au diabète. La figure 1 montre la répartition mondiale de ces tweets une fois géolocalisés. Figure 1. Répartition mondiale des tweets après géolocalisation. Dans un premier temps, le projet WDDS s’est concentré sur les utilisateurs localisés aux États-Unis, là où la majorité des tweets ont été collectés, pour analyser les principales préoccupations liées au diabète ainsi que les émotions associées à ces sujets d’intérêt(14). Au total, 11,7 millions de tweets portant sur le diabète ont tout d’abord été prétraités avec des algorithmes de machine learning afin de supprimer les doublons, les retweets, l’ironie et les tweets non personnels et non localisés aux États-Unis, ce qui représente 167 743 tweets. Comme le montre la figure 2, une surreprésentation de tweets est localisée en Californie et au Texas. Figure 2. Distribution des tweets liés au diabète aux États-Unis(14). Enfin, les tweets ne reflétant pas d’émotion particulière (mot ou émoticône dénotant une émotion) ont été ignorés. Un algorithme d’analyse de sentiment ayant pour but de détecter une opinion positive ou négative (Valence Aware Dictionary for Sentiment Reasoning) et un algorithme de clustering ont permis de regrouper 46 607 tweets restants par sujets d’intérêt. Les principales découvertes de cette étude suggèrent tout d’abord que la communauté du diabète en ligne s’apporte du soutien et de la solidarité, car de nombreux tweets sont liés à la joie et aux émotions d’affection. Ils partagent fréquemment leurs émotions et leurs craintes concernant le diabète, la vie de tous les jours avec la maladie et ses complications. En revanche, les utilisateurs expriment également des préoccupations et de la peur par rapport aux conséquences de l’augmentation des prix de l’insuline. Enfin, ils sont également incommodés par la confusion générale entre le diabète de type 1 et le diabète de type 2. En comparant ces résultats aux revenus moyens des villes, cette étude montre que l’inquiétude vis-à-vis du prix de l’insuline est positivement associée au revenu moyen des ménages urbains. Autrement dit, les villes aux revenus plus élevés sont plus susceptibles de publier des tweets à ce sujet. En revanche, dans les villes à faibles revenus, les utilisateurs sont plus susceptibles de publier des tweets concernant les histoires de leur quotidien avec le diabète et le test oral de tolérance au glucose. Enfin, dans les villes à revenus moyens, les utilisateurs de Twitter partagent leur ressenti sur les complications dues à l’insuline et à l’utilisation de la pompe à insuline. Les réseaux sont donc une source directe d’information reflétant les sentiments, les émotions et les problèmes des personnes atteintes de diabète. Ils permettent d’accéder directement aux opinions et aux peurs de la communauté active en ligne du diabète. Et demain ? Ce projet développe une méthodologie d’analyse innovante, s’appuyant sur des méthodes d’intelligence artificielle combinées à des approches cliniques et épidémiologiques traditionnelles, afin de contribuer à développer une recherche en vie réelle moderne en diabétologie. De cette approche, de nouveaux marqueurs numériques (« digital biomarkers ») de risque de complications ou de mauvaise qualité de vie vont être identifiés et, s’ils sont combinés à d’autres données cliniques ou épidémiologiques, ils permettront de mieux prévenir les dégradations de santé liées au diabète. Cette étude permet donc de commencer à caractériser pour la première fois, partout dans le monde, des profils de détresse liés au diabète et de mieux comprendre les relations entre ces facteurs psychologiques et l’état de santé des personnes diabétiques. Afin de conduire une recherche médicale réellement centrée sur les patients, il est important de les écouter et de prendre en compte leurs vécus pour définir les stratégies de recherche de demain les plus pertinentes pour eux. Le développement d’un observatoire mondial de la santé est actuellement en projet. Cet observatoire aura pour but de généraliser cette première partie de l’étude WDDS à d’autres maladies permettant alors de suivre des populations de patients en ligne en quasi-temps réel. *PhD Student, Deep Digital Phenotyping Research Unit, Department of Population Health **Director of the Department of Population Health, Head of the Deep Digital Phenotyping Research Unit Luxembourg Institute of Health, Luxembourg Remerciements Les résultats présentés dans cet article s’appuient en partie sur les travaux menés par Adrian Ahne, doctorant CIFRE à l’INSERM et Epiconcept. Nous tenons donc à le remercier chaleureusement. Nous remercions également MSDAvenir, Epiconcept et le Luxembourg Institute of Health pour leur contribution financière au projet WDDS.

Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.

pour voir la suite, inscrivez-vous gratuitement.

Si vous êtes déjà inscrit,
connectez vous :

Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :

publicité
publicité