Bref aperçu de #REGIONALES2015 depuis Twitter (1er Tour)

Depuis le 1er septembre, nous collectons via notre plateforme de scraping l’ensemble des tweets émis qui mentionnent le hashtag #REGIONALES2015. Force est de constater que les Élections Régionales 2015 n’ont pas vraiment passionné les internautes… du moins au début !

Note : cet article étant un « bref aperçu », nous ne rentrerons pas en profondeur dans les explications. Si vous souhaitez avoir plus d’informations, n’hésitez pas à nous contacter. Pour votre confort visuel, vous pouvez cliquez sur les images de cet article pour en avoir la version agrandie

Regionale2015-Global-S

 

Volume des échanges Twitter

 Septembre 2015

Regionale2015-09.Sept-S

56.198 Tweets ont été échangés durant la période, un volume qui reste quand même assez faible à trois mois des élections. Si l’on regarde les hashtags qui sont associés à #REGIONALES2015, on voit que les partis politiques ne brillent pas non plus par leur présence (note, le hashtag principal #REGIONALES2015 n’est pas comptabilisé) :

  • le #FN est en 3ème position avec 2.613 Tweets (4,65%),
  • le #PS est en 5ème position avec 2.084 Tweets (3,67%),
  • le #EELV est en 7ème position avec 1.679 Tweets (2,99%)

Octobre 2015

Regionale2015-10.Oct-S

83.396 Tweets pour la période, on commence à voir la campagne décoller (+48%), mais l’intérêt pour les élections régionales reste encore relativement bas à deux mois de l’échéance. Même constat sur les partis politiques :

  • le #FN perd une place et arrive en 4ème position avec 3.832 Tweets (4,59%),
  • le #PS lui, perd deux places et arrive en 7ème position avec 1.944 Tweets (2,33%),

Et c’est tout ! Plus aucun parti politique n’est cité dans les hashtags associés.

Novembre 2015

Regionale2015-11.Nov-S

137.916 Tweets (+65%), là les choses commencent réellement à bouger ! La « trêve politique » qui a suivi les attentats meurtriers du 13 novembre a été respectée aussi sur Twitter jusqu’au 17/18 novembre. Les discussions reprennent peu à peu une activité « normale » à partir du 22 novembre. Contrairement à ce que l’on aurait pu imaginer, les attentats n’ont pas eu réellement d’impact sur les volumes échangés : 65.856 Tweets du 1er au 13 novembre et 72.060 Tweets du 14 au 30 novembre.

Les partis politiques sont toujours aussi bas dans les hashtags associés :

  • le #FN regagne une place et se retrouve en 3ème position (7.409 Tweets — 5,37%),
  • le #PS perd deux places et arrive en 7ème position (3.441 Tweets — 2,49%),

Et toujours aucun autre parti politique représenté en association avec #REGIONALES2015.

Décembre 2015, la semaine qui a précédé les élections (du 01/12 au 05/12)

Regionale2015-12.Dec-WeekBefore-S

82.572 Tweets. Ça y est, la campagne s’accélère réellement. En une semaine nous avons un volume d’échange en très nette hausse (environ 16.500 Tweets par jour, contre 4.600 Tweets en novembre et 2.700 Tweets en octobre). Mais si la campagne démarre sur les chapeaux de roues, nous n’avons toujours que 2 partis politiques présents dans les hashtags associés :

  • le #FN passe en 1ère position avec 9.584 Tweets (11,61%%),
  • le  #PS descend à la 6ème position avec 1.769 Tweets (2,14%),

6 Décembre 2015, le jour du 1er tour

Un démarrage progressif, voir timide des échanges, qui explosera au moment de l’annonce officielle des premières estimations…

À 12h00 8.296 Tweets (1.037 Tweets par heure)

Regionale2015-12.Dec-1T_12H-S

À 18h00 24.922 Tweets (on a doublé la cadence pour atteindre 2.770 Tweets par heure depuis 12h00)

Regionale2015-12.Dec-1T_18H-S

À la fin de la journée du 6 décembre, le nombre de tweets a atteint 168.649 Tweets. En fait le volume commence à augmenter très sensiblement jusqu’à 20h où l’on atteint 41.636 Tweets échangés (soit 8.357 Tweets échangés par heure depuis 18h00), heure d’annonce officielle des premières estimations. Pour exploser littéralement après,  avec 127.013 Tweets émis entre 20h et minuit (soit 31.753 Tweets échangés par heure).

Regionale2015-12.Dec-1T-S

 

Contenu des échanges

Après avoir mesuré le volume des échanges Twitter, nous avons aussi analysé leur contenu.

1. Tweets et Retweets

Première analyse, le rapport entre les Tweets et les Retweets. Cet indicateur est très intéressant, il permet de déterminer deux schémas (et toutes les nuances qui les séparent) :

  • Si le pourcentage de Tweets est supérieur à 50%, nous sommes dans une dynamique de création de contenu (ou d’échanges intenses entre les internautes)
  • Si c’est le pourcentage de Retweets qui est supérieur à 50%, nous sommes alors dans une dynamique de rediffusion de l’information créée par d’autres.

Pour la semaine du 1er au 5 décembre, le pourcentage de Retweets est de 76%.

Extract12DecembreBefore1T-RT-S

Pendant la journée  des élections, ce pourcentage est de 71%. Que l’on peut décomposer de la manière suivante :

  • 62% de Retweets jusqu’à 12h00
  • 71% de Retweets de 12h00 à 18h00
  • 74% de Retweets de 18h00 à 20h00
  • 77% de Retweets de 20h00 à minuit

Extract12Decembre1T-RT-S

2. Hashtags associés

Un autre indice intéressant est de regarder quels hashtags supplémentaires sont associés à #REGIONALES2015.

6 décembre 2015

Au total, plus de 230.000 hashtags seront générés rien que pour cette journée.

1er au 5 décembre 2015

Plus de 140.000 hashtags seront générés.

Extract12DecembreBefore1T-Hashtags-s

3. Lexicométrie

L’analyse lexicométrique repose sur une classification hiérarchique descendante qui a pour objectif de regrouper les tweets sur un critère de cooccurrence lexicale. Autrement dit, l’analyse met dans une même classe les tweets qui ont tendance à contenir les mêmes mots.

Le corpus que nous avons étudié comprend plus de 500.000 Tweets. Le mode de fonctionnement de Twitter fait qu’une partie importante de ces tweets (71 %) relève de ce que l’on appelle des Retweets. C’est une pratique qui consiste à répercuter auprès de ses abonnés (ses followers) le message posté par un autre utilisateur. L’information contenue dans un Retweet est par conséquent la réplication exacte de l’information contenue dans le Tweet original. Si cette redondance est intéressante pour mesurer la viralité d’un message, elle n’a pas vraiment d’intérêt lorsqu’il s’agit de déterminer les thématiques abordées autour de l’utilisation d’un hashtag particulier.

Afin de le rendre utilisable et faciliter le traitement lexicométrique, nous avons procédé à un nettoyage de ces textes, notamment en retirant systématiquement les URL qui peuvent y apparaître, le hashtag #REGIONALES2015 qui a servi à l’indexation ainsi que toutes les formes de ponctuation. Le corpus final ainsi nettoyé était constitué de :

  • 185.109 occurrences,
  • 16.388 formes,
  • 9.446 hapax

Par l’utilisation de la méthode Reinert, nous obtenons 3 classes :

regionale2015-dendrogramme-S

 

  • La classe 2 rassemble les tweets produits par les différents médias et les organismes officiels,
  • Les deux autres classes regroupent les discussions entre les internautes. La classe 3 regroupe les modérés, alors que la classe 1 comporte les discussions enflammées (c’est ici que s’opposent les pro-FN et les anti-FN).

regionale2015-graph_afc-S