L’ANALYSE DES MÉDIAS SOCIAUX

View PDF version

Analyser les données des médias sociaux

Les données sont souvent qualifiées de l’or noir du XXIe siècle. Il s’agit en effet d’une ressource précieuse qui dans bien des cas est sous-exploitée. Sa simple extraction n’est pas suffisante, encore faut-il avoir un moyen de « raffiner » ces données brutes pour en extraire les informations utiles. Les données issues des médias sociaux constituent une grande partie des Big Data. Selon les derniers chiffres du Pew Research Center (2016), près de 31 millions des Français sont actifs sur les réseaux sociaux. Lorsque vous considérez que 83 % des Français utilisent Internet, vous avez une bonne idée de l’énorme quantité de données véhiculée. Les réseaux sociaux sont largement utilisés dans différents domaines de la recherche universitaire, notamment en sciences politiques, communications, journalisme et management. Autant l’influence des médias sociaux sur la politique, et particulièrement son impact dans les campagnes électorales que ses interactions avec les médias traditionnels sont des sujets d’actualités à l’échelle planétaire. De plus, les données des médias sociaux peuvent jouer un rôle de baromètre pour suivre l’évolution des attitudes sur des sujets d’actualité ou des questions controversés. En entreprises, la recherche marketing via les médias sociaux peut être utilisée à la fois pour comprendre les besoins des clients et pour développer des stratégies de marketing et communication efficaces. Par ailleurs, la recherche sur les médias sociaux permet d’analyser la perception du grand public sur l’image de l’entreprise, ou de ses produits et services, et de réaliser une veille concurrentielle. L’analyse des données textuelles issues des médias sociaux peut être considérablement simplifiée si vous disposez des bons outils. La technologie d’analyse sémantique de QDA Miner et WordStat vous permet d’extraire d’énormes quantités de données sur Twitter, Facebook, Reddit et des flux RSS, de faire le monitoring de ces réseaux, d’identifier automatiquement les mots clés et les thèmes les plus importants et de mesurer des concepts précis à l’aide d’une catégorisation thématique. Nos logiciels disposent également d’un module cartographie SIG unique vous permettant de corréler vos données de localisation et le contenu de ces médias sociaux au moyen de cartes géographiques interactives.

Des fonctions des logiciels utiles pour analyser les données des médias sociaux

Plusieurs fonctionnalités clés de QDA Miner et WordStat s’avèrent fort utiles pour l’analyse des médias sociaux.

Importation et monitoring des réseaux sociaux : Une des fonctionnalités les plus utiles dans QDA Miner est la possibilité d’importer directement des données de Twitter, de Reddit, des flux RSS, des commentaires Facebook et de faire le monito- ring de vos requêtes par la collecte automatique des nouvelles données. Les API standards ne peuvent accéder qu’à seulement 1 % des tweets publics. Accéder au Firehose de Twitter, auprès de fournisseurs tiers pour obtenir 100 % des données relatives à votre requête peut se révéler extrêmement coûteux. Avec QDA Miner, vous pouvez recueillir jusqu’à 18 000 tweets sur un sujet précis toutes les 15 minutes pendant plusieurs semaines, et cela sans frais. Le Web Collector de Provalis Research permet le monitoring de vos requêtes en continu pour accumuler automatiquement les nouvelles données tant que votre ordinateur reste allumé. Vous pouvez définir les paramètres de surveillance du Web Collector chaque minute si nécessaire.

Extraction automatique des variables : Les données des médias sociaux contiennent de précieuses métadonnées telles que la date, le lieu, le nombre de likes, le nombre d’amis ou de followers. Ces métadonnées peuvent être extraites automatiquement comme variables par QDA Miner et permettent ainsi d’effectuer des analyses plus approfondies.

Le regroupement par grappe et la modélisation thématique : L’un des plus grands défis dans l’analyse des médias sociaux est la quantité phénoménale de données à analyser. Les outils de modélisation thématique et de regroupement par grappe de WordStat vous permettent d’identifier rapidement les principaux thèmes qui ressortent de vos données. L’identification de ces thèmes dans une conversation sociale permet de suivre l’évolution des opinions à propos d’acteurs clés, d’entreprises ou de produits. Reconnaissance des caractères spéciaux : WordStat permet de préciser le type et la position des caractères spéciaux à inclure dans l’analyse des données textuelles. Cette option permet, en outre, d’extraire les URL et adresses email ou de mesurer la fréquence des hashtags dans les tweets, ce qui est souvent une information cruciale pour mesurer la popularité d’une campagne.

Tableau croisé avec la variable date : Vous pouvez mesurer l’évolution d’un thème ou d’un hashtag dans le temps en utilisant des tableaux croisés, l’analyse de correspondance, les diagrammes linéaires, etc. Les dates peuvent être transformées en jour de la semaine, en mois ou en années pour ainsi identifier les tendances saisonnières, les variations selon le jour de la semaine et l’évolution d’année en année des phénomènes mesurés. Géocodage et cartographie : Les métadonnées associées à vos données de médias sociaux peuvent contenir des informations sur la localisation qui ne sont pas sous forme de latitude et longitude. Par exemple un nom de ville, de région, de pays, un code postal ou même une adresse IP. La fonctionnalité de géocodage de QDA Miner permet de transformer ce type de données en latitude et longitude. Vous pouvez ensuite afficher la distribution spatiale de vos codes, sujets, mots clés et hashtags avec notre outil de cartographie SIG unique et facile à utiliser, disponible à la fois dans WordStat et QDA Miner.

Dictionnaires d’analyse de contenu : WordStat vous offre la possibilité d’appliquer un dictionnaire de catégorisation existant ou de créer une taxonomie personnalisée pour mesurer des concepts spécifiques. Construire des dictionnaires complets et réutilisables adaptés à vos intérêts de recherche est un excellent moyen d’automatiser le processus de catégorisation et de réduire considérablement le temps de traitement.

Fréquence des mots clés et des expressions : Mesurer la fréquence des mots clés et des expressions, que ce soit des noms de produits, de personnes ou de compagnies, permet de mesurer la visibilité d’un lieu ou d’une organisation comparativement à la concurrence.

Exemples d’études ayant utilisé les logiciels WordStat et QDA Miner

Nous avons répertorié ici des exemples d’études ayant utilisé QDA Miner et WordStat pour analyser des données de médias sociaux. Ils démontrent la diversité des domaines utilisant les médias sociaux comme principale source de données et les différentes approches méthodo- logiques utilisées pour analyser ce type de données.

Les médias sociaux jouent un rôle de plus en plus important dans les campagnes politiques et les utilisateurs de réseaux sociaux utilisent ces plates-formes pour débattre des questions électorales qui les concernent. Bruns et Burgess (2011) ont suivi les échanges en ligne pour identifier les thèmes clés autour du hashtag #aussievotes sur Twitter lors des élections fédérales australiennes de 2010. Ils ont utilisé WordStat pour extraire les mots-clés les plus fréquents et déterminer les cinq principaux thèmes. Ils ont suivi ces thèmes au fil du temps pour déterminer leurs relations avec la couverture médiatique et les événements politiques. Al-Rawi (2016) dans son étude comparative des nouvelles sur Twitter a utilisé WordStat pour mesurer la fréquence et la cooccurrence des mots-clés et des thèmes les plus fréquents mentionnés dans les manchettes de plus de 360 000 tweets diffusés sur les pages Twitter de 12 chaînes de nouvelles télévisées en anglais et en arabe pour connaître leur sélection d’informations et leur couverture de l’actualité. Dans leur article sur la perception des utilisateurs de Twitter sur le cannabis, Lamy et al. (2016) ont utilisé QDA Miner pour coder manuellement un échantillon de 3000 tweets et ressortir la source et le sentiment. La fiabilité du codage a été testée à l’aide de la fonction d’accord inter-juges de QDA Miner. WordStat a ensuite été utilisé pour identifier les mots les plus fréquents attribués à chaque source et mesurer les sentiments qui s’y rattachent ainsi que les formes de langages caractéristiques à chaque source dans le but de tenter d’automatiser le processus d’analyse de contenu. La sensibilisation aux droits des transgenres est un sujet d’actualité dans les sphères sociales et politiques. Miller et Behm-Morawitz (2016) ont mené une étude sur l’analyse des tweets postés en direct durant l’entrevue de Caitlyn.

Jenner lors de l’émission de Diane Sawyer. WordStat a été utilisé pour construire un dictionnaire à des fins de classification des tweets selon des thèmes prédéfinis. La cooccurrence de ces thèmes a ensuite été examinée avec QDA Miner pour explorer en profondeur le sens et le contexte d’utilisation de ces thèmes. Ils ont constaté que, malgré la négativité exprimée dans les commentaires des nouvelles en ligne, l’analyse des flux de tweet a démontré la prédominance marquée des réactions positives à l’entrevue.

Les médias sociaux, en particulier Twitter, deviennent des outils de marketing et communication de plus en plus indispensables. Cruz et Lee (2014) reconnaissent les défis auxquels font face les entreprises pour développer des campagnes marketing efficaces sur Twitter. Ils ont utilisé les outils d’analyse de contenu de WordStat pour analyser les tweets de 23 multinationales. Les tweets ont été classés en fonction des cinq types de personnalité de la marque de Aaker. Une analyse des sentiments a ensuite été effectuée à l’aide du Lexicoder Sentiment Dictionary. Les résultats révèlent que le choix des mots et le type de média utilisé sont des facteurs déterminants dans le succès d’une campagne et devraient être pris en considération par les gestionnaires des médias sociaux pour la mise au point d’une stratégie de marketing et communication efficace.

Études faisant références aux médias sociaux et ayant utiliées WordStat et QDA Miner

Al-Rawi, A. (2014). Framing the online women’s movements in the Arab world. Information, Communication & Society, 17(9), 1147-1161.

Al-Rawi, A. (2016). News Organizations 2.0: A comparative study of Twitter news. Journalism Practice, 11(6), 705-720.

Al-Rawi, A. (2016). News values on social media: News organizations’ Facebook use. Journalism, Theory, Practice & Criticism, 17(3), 1-19.

Al-Rawi, A. (2016). Understanding the Social Media Audiences of Radio Stations. Journal of Radio & Audio Media, 23(1), 50-67.

Al-Rawi, A. (2017). Assessing public sentiments and news preferences on Al Jazeera and Al Arabiya. International Communication Gazette, 79(1), 26-44.

Brennan, R., & Croft, R. (2012). The use of social media in B2B marketing and branding: An exploratory study. Journal of Customer Behaviour, 11(2), 101-115.

Bruns, Axel & Burgess, Jean E. (2011). #Ausvotes : how Twitter covered the 2010 Australian federal election. Communication, Politics and Culture, 44(2), 37-56.

Chen, H. L. (2012). Identifying factors of online news comments. Proceedings of the Association for Information Science and Technology, 49(1), 1-4.

Conway, B. A., Kenski, K., & Wang, D. (2015). The Rise of Twitter in the Political Campaign: Searching for Intermedia Agenda-Setting Effects in the Presidential Primary. Journal of Computer-Mediated Communication, 20(4), 363-380.

Cruz, R. A. B., & Lee, H. J. (2014). The Brand Personality Effect: Communicating Brand Personality on Twitter and its Influence on Online Community Engagement. Journal of Intelligence and Information Systems, 20(1), 67-101.

Chu, K. H., Sidhu, A. K., & Valente, T. W. (2015). Electronic cigarette marketing online: a multi-site, multi-product comparison. JMIR public health and surveillance, 1(2).

Davalos, S., Merchant, A., Rose, G. M., Lessley, B. J., & Teredesai, A. M. (2015). ‘The good old days’: An examination of nostalgia in Facebook posts. International Journal of Human – Computer Studies, 83, 83-93.

Dexter, S., & Kozbelt, A. (2013, June). Closing the gaps: toward unifying and deepening the study of creativity. In Proceedings of the 9th ACM Conference on Creativity & Cognition (pp. 366-369). ACM.

Groshek, J., & Al-Rawi, A. (2013). Public sentiment and critical framing in social media content during the 2012 US presidential campaign. Social Science Computer Review, 31(5), 563-576.

Groshek, J., & Engelbert, J. (2013). Double differentiation in a cross-national comparison of populist political movements and online media uses in the United States and the Netherlands. New Media & Society, 15(2), 183-202.

Lamy, F. R., Daniulaityte, R., Sheth, A., Nahhas, R. W., Martins, S. S., Boyer, E. W., & Carlson, R. G. (2016). “Those edibles hit hard”: Exploration of Twitter data on cannabis edibles in the U.S. Drug and Alcohol Dependence, 164, 64-70.

Luengo, F., Morillo, C., & Yedra, Y. (2017). Categorización de usuarios de Twitter/Categorizing Twitter users. Revista Tecnocientífica URU, (11), 35-44.

Miller, B., & Behm-Morawitz, E. (2017). Exploring social television, opinion leaders, and Twitter audience reactions to Diane Sawyer’s coming out interview with Caitlyn Jenner. International Journal of Transgenderism, 18(2), 140-153.

Nugroho, A., Harwani, Y., Dewita, A., & Sihite, J. (2015). Is It Traditional or Contemporary Marketing Strategy? A Textual Cluster Analysis @MercuBuana_Reg. Mediterranean Journal of Social Sciences, 6(5 S5), 26.

Ruggiero, A., & Vos, M. (2014). Social media monitoring for crisis communication: Process, methods and trends in the scientific literature. Online Journal of Communication and Media Technologies, 4(1), 105.

Settles, P. (2016). What Goes Up Must Not Come Down: The Tweet Retraction Process of Politicians. (Unpublished Thesis Project). Western Kentucky University, Bowling Green, KY.

Sevin, H. E. (2014). Understanding cities through city brands: City branding as a social and semantic network. Cities, 38, 47-56.

Siddiqua, U. A., Ahsan, T., & Chy, A. N. (2016). Combining a rule-based classifier with weakly supervised learning for twitter sentiment analysis. In Innovations in Science, Engineering and Technology (ICISET), International Conference on (pp. 1-4). IEEE.

Stockemer, D., & Barisione, M. (2017). The ‘new’discourse of the Front National under Marine Le Pen: A slight change with a big impact. European Journal of Communication, 32(2), 100-115.

Tse, Y. K., Zhang, M., Doherty, B., Chappell, P., & Garnett, P. (2016). Insight from the horsemeat scandal: Exploring the consumers’ opinion of tweets toward Tesco. Industrial Management & Data Systems, 116(6), 1178-1200.

Tucker, I., Goodings, L., Raymond-Barker, B., & Molloy-Vaughan, S. (2015). Social Media and Austerity. Working Papers of the Communities & Culture Network+, 5.

Vasi, I. B., Walker, E. T., Johnson, J. S., & Tan, H. F. (2015). “No Fracking Way!” Documentary Film, Discursive Opportunity, and Local Opposition against Hydraulic Fracturing in the United States, 2010 to 2013. American Sociological Review, 80(5), 934-959.

Références

Greenwood, S., Perrin, A., Duggan, M., & Pew Research Center (2016). Social media update 2016: Facebook usage and engagement is on the rise, while adoption of other formats holds steady.