• Le Politoscope

    Présentation du projet

Pourquoi un politoscope ?

A l’instar des partis politiques, qui utilisent les Big Data issus des réseaux sociaux pour analyser les opinions de leurs concitoyens, nous avons souhaité pour cette présidentielle mettre les outils de la recherche à disposition des citoyens via ce « macroscope politique ». A l’ère du numérique, ce rééquilibrage dans l’utilisation des outils du Big Data est à notre sens indispensable pour préserver un accès démocratique à l’information.

Twitter est devenu un nouveau média d’information ainsi qu’un passage obligé pour tout groupe qui cherche à influencer l’opinion publique d’une manière ou d’une autre, y compris pour certains, en publiant de fausses informations (« fake news »).

Les réseaux sociaux grossissent ainsi la masse de données dans laquelle nous sommes chaque jour plongés, et qui tend à nous détourner d’une analyse approfondie, et sur le long terme, de l’actualité.

Les équipes de campagne utilisent désormais les services de sociétés d’étude des médias et réseaux sociaux qui leur produisent des analyses et des tendances concernant les aspirations des citoyens.

Ces analyses sont réservées à un petit nombre d’utilisateurs ; les méthodologies sont la plupart du temps confidentielles.

Le but du Politoscope est d’inverser les rôles en permettant au “grand public” de plonger dans les masses de données générées sur les réseaux sociaux à l’approche des présidentielles grâce à des outils et méthodes d’analyses produites par la recherche.

L’ambition de ce macroscope est d’une part, d’aider à mieux contextualiser sur le temps long les prises de parole des hommes politiques; d’autre part, de permettre d’identifier sur les temps courts des actions collectives visant à déplacer le débat public.

Présentation PDF

Transparents (PDF) de la présentation presse du Politoscope, 3 avril 2017

Le Politoscope analyse de façon automatique des millions de tweets. Les opinions exprimées dans ces tweets n’engagent que leurs auteurs et ne sauraient engager ni réfléter la position du CNRS.

Qui contribue au Politoscope ?

Le Politoscope est une initiative de l’Institut des Systèmes Complexes de Paris Ile-de-France (ISC-PIF, laboratoire CNRS). Via la plateforme Multivac, l’ISC-PIF mutualise des masses de données sur les débats de la présidentielle 2017 au sein d’un réseau inter-institutionnel de chercheurs et ingénieurs. Les analyses et plate-formes que vous trouverez sur ce site sont le fruit des collaborations au sein de ce réseau de recherche sur ces données. La majorité des données utilisées pour ces analyses proviennent de Twitter.

Quelles sont les données ?

Mise en garde : La plupart des analyses proposées sur ce site utilisent la plateforme Twitter comme source de données sur les débats politiques. La communauté Twitter n’est pas représentative de la population française et les interprétations de ce qui est proposé devront en tenir compte. 

Twitter est néanmoins utilisé massivement dans la communication des candidats et des groupes politiques. Les messages de cette plateforme sont suffisamment relayés, y compris dans les médias nationaux, pour que les dynamiques collectives observées sur Twitter soient révélatrices des dynamiques d’opinion au niveau national, voire les influencent.

Twitter est une plateforme de publication de messages courts (140 caractères max.) à destination du web. Chaque personne disposant d’un compte peut publier librement des messages qui peuvent être vus sans restriction par l’ensemble des internautes. Un système d’abonnement permet de suivre d’autres utilisateurs et d’être informé de tout nouveau message. Des tweets sont très souvent affichés en dehors de la plateforme Twitter sur d’autres sites ou dans les médias.

Exemple de tweet : annonce de François Hollande.

500 millons de tweets sont envoyés chaque jour dans le monde et 319 millions de comptes Twitter sont actifs chaque mois. La France compte environ 6 millons de comptes, dont les propriétaires sont de tous âges, avec une prépondérance des moins de 35 ans.

Twitter propose en accès libre et en temps réel un échantillon des tweets qui sont échangés sur sa plateforme (environ 1%). Il est également possible de suivre un compte et de récolter l’intégralité des tweets qu’il publie.

Le Politoscope suit depuis août 2016 plus de 3000 comptes Twitter appartenant à des médias et des personnalités du monde des médias, ainsi que certains flux ciblés thématiquement à partir de mots-clés et hashtags dans la limite du 1% Twitter (ex. #présidentielle2017). Plusieurs centaines de milliers de tweets politiques sont ainsi récoltés et analysés chaque jour.

Sélection des candidats et de leurs communautés

Tous les candidats n’ont pas la même stratégie de communication et certains utilisent relativement peu Twitter. Nous respectons ce choix et nous avons décidé de ne présenter dans ce dispositif que les candidats qui tweetent suffisamment pour que leurs messages soient représentatifs de leur programme politique.

Le nombre minimal de tweets pour apparaître dans l’interface ‘les candidats et leurs communautés’ a été fixé à 500 au 31 mars 2017. Six candidats ont été retenus, classés dans l’interface par ordre alphabétique du nom de leur parti. Nous avons contacté les 5 autres équipes de campagnes des autres candidats en leur proposant, s’ils estimaient que Twitter était un média représentatif de leur programme, d’être ajouté au Politoscope (voir le mail).

Identification des thèmes

Revenu universel, suppression de postes, patriotisme économique, souffrance au travail, etc. chaque communauté politique mobilise de manière privilégiée certaines expressions pour défendre ses idées dans le débat politique.

Avec Gargantext (outil de text-mining), nous avons analysé les mesures proposées par l’ensemble des candidats ainsi que tous leurs tweets captés par le Politoscope. Cela nous a permis de délimiter un vocabulaire spécifique au discours politique (liste disponible sur http://politoscope.org), dont les termes ont été catégorisés en grands thèmes de manière semi-automatique.

Cette démarche permet d’associer un tweet à un thème en fonction des termes qu’il mobilise. Cette définition a le mérite d’être automatisable, bien qu’il arrive de temps à autre que des tweets soient “mal classés” ou non pertinents.

Une sélection de thèmes est proposée dans ce dispositif. Celle-ci n’a pas prétention à être exhaustive. D’autres thèmes sont disponibles sur le site du Politoscope et il vous est également possible d’en proposer de nouveaux.

Pour ne prendre qu’un exemple, sous la catégorie Économie & fiscalité sont regroupés tous les tweets qui mentionnent au moins une fois l’un des termes suivants :

entreprise*; pme; pmi; actionnaire*; relocalisation*; crédit impôt; nationalisation*; commerçant*; plus-values; délocalisation*; cotisations sociales; scop; niches fiscales; gafa; cice; taux d’imposition; retenue à la source; crédit impôt-recherche; impôt sur les sociétés; austérité; fisc*; impôt; imposition; cotisations sociales; retenue à la source; etc.

Dans un souci d’équité et afin d’être le plus exhaustif possible, nous avons invité le 28 février 2018 toutes les équipes de campagne à nous communiquer des éléments concernant leur programme et les mot-clés qu’ils souhaitaient mettre en avant.

Malgré tout le soin apporté à la définition des thèmes, il est possible que la manière de parler de certains thèmes pour certains candidats ne soit pas bien restituée. Les analyses proposées par le Politoscope sont avant tout une invitation à explorer plus en détails la teneur des discours politiques. Nous vous invitons à garder un esprit critique lorsque vous interprétez les résultats.

Identification des communautés politiques

L’exposition de cette méthodologie fait l’objet d’un billet à part entière.