paint-brush
Classification multilingue grossière des positions politiques des médias : résumé et conclusionspar@mediabias
111 lectures

Classification multilingue grossière des positions politiques des médias : résumé et conclusions

Trop long; Pour lire

Dans cet article, les chercheurs analysent la neutralité des articles de presse générés par l’IA et l’évolution des positions dans toutes les langues à l’aide d’évaluations authentiques des médias.
featured image - Classification multilingue grossière des positions politiques des médias : résumé et conclusions
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Cet article est disponible sur arxiv sous licence CC BY-NC-SA 4.0 DEED.

Auteurs:

(1) Cristina España-Bonet, DFKI GmbH, Campus informatique de la Sarre.

Tableau des liens

4. Résumé et conclusions

Les sources médiatiques ont une ligne éditoriale et un parti pris associé. Il est difficile pour les humains de se débarrasser des préjugés politiques, mais en être conscient nous aide à avoir une vision globale de l’actualité. Les préjugés sont parfois évidents et/ou apparaissent sous la forme de textes nuisibles, mais ils sont parfois subtils et difficiles à détecter. Ces préjugés subtils et cachés sont potentiellement dangereux et conduisent à des manipulations lorsque nous n’en sommes pas conscients. Dans ce travail, nous avons systématiquement étudié les biais politiques subtils derrière ChatGPT et Bard, ceux qui apparaissent sans attribuer aucun rôle personnel (Deshpande et al., 2023). Nous avons montré que l'orientation de ChatGPT change avec le temps et qu'elle est différente selon les langues. Entre février et août 2023, ChatGPT est passé d'une orientation politique de gauche à neutre, avec une période de droite au milieu pour l'anglais et l'espagnol. L'évolution de Bard ne peut pas encore être étudiée. Sa version actuelle, en date d'août 2023, montre systématiquement une tendance à gauche pour les 4 langues étudiées. Ce biais est indépendant des erreurs factuelles générées par le modèle et doit également être pris en compte par ses utilisateurs. Nous proposons des modèles pour vérifier régulièrement les biais dans les générations de textes pour les États-Unis, l'Allemagne et l'Espagne, ainsi que dans des contextes politiques et des langues étroitement liés, en utilisant une approche zéro-shot.


En tant que sous-produit de notre analyse, nous avons créé un corpus multilingue de 1,2 million d'articles de journaux avec des annotations grossières sur la position et le sujet politiques. Nous montrons que la supervision à distance nous permet de construire des modèles significatifs pour une classification grossière des positions politiques, à condition que le corpus soit diversifié. Nous mettons à disposition ces données avec les générations LM et notre code via Zenodo (España-Bonet, 2023) et Github.[12]


[12] https://github.com/cristinae/docTransformer