Tweet Ids Data Set

Tweets Ids collected by the Politoscope Project (http://politoscope.org) through the ISC-PIF Multivac Platform (Maziyar Panahi, http://multivac.iscpif.fr) from Aug 1st, 2016 until May 8, 2017 (French Presidential Elections) (2018-03-08)

Cite this dataset : Chavalarias, David; Panahi, Maziyar; Gaumont, Noé, 2018, “Politoscope data : tweets Ids for the 2017 French Presidential Elections”, https://doi.org/10.7910/DVN/6739SP, Harvard Dataverse, V1

Graphs and other data derived from the paper

These data set contains intermediary results processed on the tweets dataset (for example text-mining results), additional data from the candidates’ programs and anonymized graphs of the political landscape.

Cite this dataset : Gaumont, Noé; Panahi, Maziyar; Chavalarias, David, 2018, “Data for : Reconstruction of the socio-semantic dynamics of political activist Twitter networks – Method and application to the 2017 French presidential election”, https://doi.org/10.7910/DVN/AOGUIA, Harvard Dataverse

Principaux résultats

Les communautés politiques peuvent être reconstruites à partir des données de Twitter

  • L’utilisation de Twitter par les communautés politiques permet de reconstituer l’évolution du paysage politique d’un pays pendant une campagne présidentielle à travers la correspondance entre les différents courants politiques et les communautés reconstruites algorithmiquement à partir de leurs traces numériques,
  • Au événements politiques clés (officiels et non officiels) correspondent des structures mathématiques identifiables dans le paysage politique reconstruit, comme la division, la fusion, la disparition, l’apparition ou le changement abrupt de la taille des communautés,

Cette reconstruction donne un aperçu des structures des communautés politiques et de leur dynamique (cas de la France)

  • Les communautés en ligne peuvent se reconfigurer en très peu de temps à la suite d’événements clés tels que des victoires aux primaires ou des alliances entre dirigeants,
  • Il existe une structure communautaire politique générique sur Twitter, composée d’un noyau de militants qui restent plusieurs semaines au sein de la communauté, d’un ensemble de membres périphériques beaucoup plus volatile et d’un ensemble intermédiaire de comptes couvrant un large spectre de participation,
  • Les communautés politiques sont hétérogènes en ce qui concerne l’activité en ligne, l’engagement, l’intégration politique et la politisation de leurs membres, ce qui suggère à la fois des profils différents d’engagement politique d’une communauté à l’autre et une dynamique distincte pour recruter de nouveaux membres. La caractérisation, à partir de traces numériques, de la variété des processus qui soutiennent la cohésion d’une communauté reste un défi ouvert,
  • Les personnes ayant des opinions politiques extrêmes ont tendance à être les plus attachées à leur idéologie,

Cette reconstruction donne un aperçu de l‘impact des communautés sur la diffusion de l’information et en particulier sur leur rôle dans le phénomène des fausses nouvelles (le cas de la France)

  • La structure de la communauté en ligne limite la diffusion de l’information parmi les activistes de Twitters, la plupart des cascades de retweets se produisant au sein d’une ou deux communautés,
  • Le paysage politique français de Twitter ressemble à un “split brain” du point de vue des fausses nouvelles : un “hémisphère” produit ou diffuse des fausses nouvelles, l’autre produit ou diffuse des réfutations,
  • Les fausses nouvelles semblent être plus populaires que leurs réfutations en termes de nombre de comptes atteints, mais le phénomène s’inverse au niveau communautaire : la diffusion des fausses nouvelles tend à se limiter à moins de communautés que les autres nouvelles politiques. Par conséquent, dans l’évaluation de l’impact des fausses nouvelles, il faut tenir compte non seulement du nombre de personnes touchées, mais aussi de la diversité des communautés concernées.
  • Dans l’ensemble, sur Twitter, pour la politique française, le phénomène des fausses nouvelles semble assez limité tant en termes de volume (ordre de grandeur de 0,01%) qu’en termes de diversité des communautés concernées. (72,9% de toutes les fausses nouvelles analysées ont été produites et diffusées par seulement deux communautés politiques). Leur diffusion est donc avant tout l’œuvre des communautés politiques et non de profanes en politiques

Français

Référence :

Gaumont, N., Panahi, M., Chavalarias, D., 2018. Reconstruction of the socio-semantic dynamics of political activist Twitter networks—Method and application to the 2017 French presidential election. PLOS ONE 13, e0201879. https://doi.org/10.1371/journal.pone.0201879

Résumé

Contexte Les espaces numériques, et en particulier les sites de réseaux sociaux, sont de plus en plus présents et influents dans le fonctionnement de nos démocraties. Dans cet article, nous proposons une méthodologie intégrée pour la collecte de données, la reconstruction, l’analyse et la visualisation du développement du paysage politique d’un pays à partir des données de Twitter.

Methode La méthode proposée repose uniquement sur les interactions entre les comptes Twitter et est indépendante des caractéristiques des contenus partagés tels que la langue des tweets. Nous validons notre méthodologie sur une étude de cas portant sur l’élection présidentielle française de 2017 (60 millions d’échanges Twitter entre plus de 2,4 millions d’utilisateurs) via deux méthodes indépendantes : la comparaison entre notre catégorisation politique automatisée et une catégorisation humaine basée sur l’évaluation d’un échantillon de 5000 descriptions de profils ; et la correspondance entre les reconfigurations détectées dans le paysage politique reconstruit et les événements politiques clés rapportés dans les médias. Cette dernière validation démontre la capacité de notre approche à refléter avec précision les reconfigurations de la scène politique d’un pays à partir des données des réseaux sociaux.

Résultats Nous nous sommes appuyés sur cette reconstruction pour donner un aperçu des dynamiques d’opinion et de la reconfiguration des communautés politiques qui sont en jeu lors d’une élection présidentielle. Tout d’abord, nous proposons une description et une analyse quantitative de l’engagement politique des membres des communautés politiques. Ensuite, nous analysons l’impact des communautés politiques sur la diffusion de l’information et en particulier sur leur rôle dans le phénomène des fausses nouvelles. Nous mesurons un effet différentiel de chambre d’écho (echo chamber) sur les différents types de nouvelles politiques (fausses nouvelles, démentis, nouvelles standards) causées par la structure communautaire. Nous soulignons l’importance de prendre en compte les méso-structures des réseaux politiques pour comprendre les phénomènes de type “fausses nouvelles” (fake news).

Conclusions En donnant accès à un niveau intermédiaire, entre les enquêtes sociologiques de terrain et les grandes études statistiques (telles que celles menées par des organisations nationales ou internationales), nous démontrons que les données des réseaux sociaux permettent de qualifier et de quantifier l’activité des communautés politiques dans un environnement politique multipolaire, ainsi que leur évolution et reconfiguration temporelle, leur structure, leurs stratégies d’alliance et leurs particularités sémantiques au cours d’une campagne présidentielle à travers l’analyse de leurs traces numériques. Nous concluons ce document par un commentaire sur les implications politiques et éthiques de l’utilisation des données des réseaux sociaux en politique. Nous insistons sur l’importance de développer des macroscopes sociaux qui permettront aux citoyens de mieux comprendre la manière dont collectivement ils font société. Nous proposons comme exemple le \textit{Politoscope}, un macroscope qui restitue certains de nos résultats d’une manière interactive.

English

Reference : Gaumont, N., Panahi, M., Chavalarias, D., 2018. Reconstruction of the socio-semantic dynamics of political activist Twitter networks—Method and application to the 2017 French presidential election. PLOS ONE 13, e0201879. https://doi.org/10.1371/journal.pone.0201879

Abstract

Background Digital spaces, and in particular social networking sites, are becoming increasingly present and influential in the functioning of our democracies. In this paper, we propose an integrated methodology for the data collection, the reconstruction, the analysis and the visualization of the development of a country’s political landscape from Twitter data.

Method The proposed method relies solely on the interactions between Twitter accounts and is independent of the characteristics of the shared contents such as the language of the tweets. We validate our methodology on a case study on the 2017 French presidential election (60 million Twitter exchanges between more than 2.4 million users) via two independent methods: the comparison between our automated political categorization and a human categorization based on the evaluation of a sample of 5000 profiles descriptions ; the correspondence between the reconfigurations detected in the reconstructed political landscape and key political events reported in the media. This latter validation demonstrated the ability of our approach to accurately reflect the reconfigurations at play in the off-line political scene.

Results We built on this reconstruction to give insights into the opinion dynamics and the reconfigurations of political communities at play during a presidential election. First, we propose a quantitative description and analysis of the political engagement of members of political communities. Second, we analyze the impact of political communities on information diffusion and in particular on their role in the fake news phenomena. We measure a differential \textit{echo chamber} effect on the different types of political news (fake news, debunks, standard news) caused by the community structure and emphasize the importance of addressing the meso-structures of political networks in understanding the fake news phenomena.

Conclusions Giving access to an intermediate level, between sociological surveys in the field and large statistical studies (such as those conducted by national or international organizations) we demonstrate that social networks data make it possible to qualify and quantify the activity of political communities in a multi-polar political environment ; as well as their temporal evolution and reconfiguration, their structure, their alliance strategies and their semantic particularities during a presidential campaign through the analysis of their digital traces. We conclude this paper with a comment on the political and ethical implications of the use of social networks data in politics. We stress the importance of developing social macroscopes that will enable citizens to better understand how they collectively make society and propose as example the Politoscope, a macroscope that delivers some of our results in an interactive way.

2016 - 2018 © Copyright - ISC-PIF / CNRS
%d bloggers like this: