paint-brush
Une comparaison de la distribution des sources et du chevauchement des résultats dans les moteurs de recherche Webpar@browserology
504 lectures
504 lectures

Une comparaison de la distribution des sources et du chevauchement des résultats dans les moteurs de recherche Web

Trop long; Pour lire

L'étude compare les résultats de recherche de Google, Bing, DuckDuckGo et Metager, révélant que Google affiche davantage de domaines uniques dans les meilleurs résultats. Alors que les principales sources comme Wikipédia et les sites d'actualités dominent sur tous les moteurs, Metager présente un chevauchement plus important avec Bing. Cela suggère que l’utilisation de moteurs de recherche alternatifs aux côtés de Google peut offrir une plus grande variété de sources et de perspectives aux utilisateurs.
featured image - Une comparaison de la distribution des sources et du chevauchement des résultats dans les moteurs de recherche Web
Browserology: Study & Science of Internet Browsers HackerNoon profile picture
0-item

Auteurs:

(1) Yagci, Nurce, HAW Hambourg, Allemagne & [email protected] ;

(2) Sünkler, Sebastian, HAW Hambourg, Allemagne & [email protected] ;

(3) Häußler, Helena, HAW Hambourg, Allemagne & [email protected] ;

(4) Lewandowski, Dirk, HAW Hambourg, Allemagne & [email protected].

Tableau des liens

Résumé et introduction

Revue de littérature

Objectifs et questions de recherche

Méthodes

Résultats

Discussion

Conclusion, données de recherche, remerciements et références

ABSTRAIT

En ce qui concerne les moteurs de recherche, les utilisateurs préfèrent généralement Google. Notre étude vise à trouver les différences entre les résultats trouvés dans Google par rapport aux autres moteurs de recherche. Nous avons comparé les 10 meilleurs résultats de Google, Bing, DuckDuckGo et Metager, en utilisant 3 537 requêtes générées par Google Trends en Allemagne et aux États-Unis. Google affiche plus de domaines uniques dans les premiers résultats que ses concurrents. Wikipédia et les sites d’information sont globalement les sources les plus populaires. Certaines sources principales dominant les résultats de recherche, la répartition des domaines est également cohérente sur tous les moteurs de recherche. Le chevauchement entre Google et Bing est toujours inférieur à 32 %, tandis que Metager a un chevauchement plus élevé avec Bing qu'avec DuckDuckGo, allant jusqu'à 78 %. Cette étude montre que l'utilisation d'un autre moteur de recherche, notamment en plus de Google, offre une plus grande variété de sources et peut amener l'utilisateur à découvrir de nouvelles perspectives.

MOTS CLÉS

Recherche Internet; moteur de recherche; grattage Web ; Google; comparaison des sources

INTRODUCTION

Pourquoi devrait-il y avoir plus d’un moteur de recherche ? Même si les utilisateurs peuvent préférer un moteur de recherche à d'autres en raison de sa convivialité, de ses fonctionnalités spécialisées ou d'une intégration plus pratique dans leur environnement technique, la question qui nous intéresse dans cette recherche est de savoir si un utilisateur bénéficiera de l'utilisation d'un autre moteur de recherche que Google lorsqu'il s'agit de à trouver des résultats provenant de différentes sources. Notre point de départ est le fait que Google est de loin le moteur de recherche le plus utilisé (StatCounter, 2022), que les utilisateurs font dans une large mesure confiance aux moteurs de recherche pour leur fournir des résultats pertinents et utiles (Commission européenne, 2016 ; Purcell et al., 2012), et que seuls certains utilisateurs utilisent un autre moteur de recherche en plus de Google (Schultheiß & Lewandowski, 2021).


Les utilisateurs accordent une grande confiance aux moteurs de recherche. Cela se reflète dans les 91 % d’utilisateurs américains qui déclarent trouver toujours ou la plupart du temps ce qu’ils recherchent, et dans les 66 % qui estiment que les moteurs de recherche constituent une source d’information juste et impartiale (Purcell et al., 2012). . En outre, 78 % des utilisateurs européens d’Internet et des plateformes en ligne déclarent croire que les résultats de leurs moteurs de recherche sont les plus pertinents (Commission européenne, 2016). À l’échelle mondiale, les utilisateurs font plus confiance aux moteurs de recherche qu’à toute autre source (y compris les médias traditionnels) en matière d’actualités (Edelman Trust Institute, 2022) et les utilisateurs font beaucoup plus confiance aux informations trouvées via la recherche qu’aux informations trouvées sur les réseaux sociaux.

(Newman et coll., 2021).


Étant donné que le Web est énorme et que différents moteurs de recherche peuvent préférer différentes sources, il est intéressant de voir si les principales sources affichées dans les résultats de recherche diffèrent d'un moteur de recherche à l'autre. Il se peut qu'un moteur de recherche alternatif préfère les résultats provenant de sources « alternatives », par exemple en termes d'orientation politique ou en préférant les fournisseurs de contenu non commerciaux. Tout cela se résume à savoir si les moteurs de recherche alternatifs sont réellement des alternatives en ce qui concerne les résultats qu'ils affichent. Si tel était le cas, les avantages possibles de l’utilisation d’un moteur de recherche autre que Google incluent la recherche de résultats différents, la recherche de résultats supplémentaires et la recherche de résultats plus pertinents. Quel que soit l'objectif qu'un utilisateur souhaite atteindre, il aura besoin d'autres résultats que ceux de Google. Il est donc intéressant de voir si d’autres moteurs de recherche fournissent de tels résultats aux utilisateurs.


Un débat est en cours sur les moteurs de recherche alternatifs et sur la manière de briser la domination de Google sur le marché des moteurs de recherche. Les approches vont de l'établissement de moteurs de recherche alternatifs uniques à la construction d'infrastructures pour de telles alternatives (par exemple, Lewandowski, 2019) ; voir aussi Mager, 2014). Alors que Google domine le marché des moteurs de recherche (StatCounter, 2022), il semble souvent qu’il n’existe aucune alternative. En revanche, le nombre de moteurs de recherche alternatifs (ou simplement « autres ») est souvent surestimé. De nombreux moteurs de recherche semblent être de simples portails de recherche affichant les résultats d'un partenaire au lieu de générer les résultats à partir de leur propre index. Par exemple, Yahoo et Ecosia obtiennent leurs résultats de Bing et ne peuvent donc pas être considérés comme des moteurs de recherche à part entière. Mais il peut néanmoins y avoir d’autres raisons d’utiliser un moteur de recherche sans son propre index. Certains des avantages uniques annoncés par les moteurs de recherche alternatifs sont la confidentialité (par exemple, Startpage et DuckDuckGo) ou le fait d'être une entreprise qui investit ses bénéfices dans des projets environnementaux (par exemple, Ecosia). Un autre type de moteur de recherche est le méta-moteur de recherche (par exemple Metager). Un tel moteur envoie les requêtes à plusieurs autres moteurs de recherche, puis regroupe et reclasse les meilleurs résultats. Nous pensons qu'il est particulièrement intéressant de savoir si une telle approche aboutira à une plus grande variété de résultats de recherche, c'est-à-dire à des résultats provenant d'un ensemble de sources plus diversifiées. Ainsi, dans le cadre de notre recherche, nous considérerons tout moteur de recherche qui soit possède son propre index, soit propose une sélection unique et un reclassement des résultats d'un ou plusieurs index comme moteur de recherche alternatif. Nous sommes particulièrement intéressés par les différences dans la distribution des sources ; la pertinence des résultats sort du cadre de notre recherche.


Il y a plus de 20 ans, Introna et Nissenbaum (2000) affirmaient que les moteurs de recherche, en tant qu'opérations commerciales, avaient tendance à préférer les grands sites Web et que, par conséquent, une partie du Web, c'est-à-dire les petits sites, restait cachée. Les études mesurant ce que les utilisateurs sélectionnent semblent le confirmer : Goel et al. (2010) ont constaté qu'au sein de Yahoo, seuls 10 000 sites Web représentent environ 80 % des clics générés. Il est important de noter que cela ne résulte pas simplement de la préférence des utilisateurs pour des sources particulières, mais du fait que les utilisateurs sélectionnent principalement parmi les meilleurs résultats affichés par le moteur de recherche. Ce qui est hors de la vue immédiate des utilisateurs ne sera pas choisi (Lewandowski & Kammerer, 2021).


Il est frappant de constater que peu d’études ont comparé les résultats entre différents moteurs de recherche ces dernières années. Dans l’ensemble, des études plus anciennes (voir la section sur l’analyse de la littérature) ont révélé que les meilleurs résultats des différents moteurs de recherche ne se chevauchaient pas trop. Dans cet article, nous expliquons en quoi les meilleurs résultats de Google diffèrent des alternatives et, par conséquent, s'il vaut la peine pour un utilisateur d'envisager ces alternatives. Si un moteur de recherche autre que Google produisait des résultats très similaires à ceux de Google, un utilisateur ne bénéficierait pas beaucoup de l'utilisation de ce moteur de recherche lorsque la variété des sources est prise en compte.


Cet article est disponible sur arxiv sous licence CC 4.0.

Image principale de Justin Morgan sur Unsplash