paint-brush
Una comparación de la distribución de fuentes y la superposición de resultados en los motores de búsqueda webpor@browserology
504 lecturas
504 lecturas

Una comparación de la distribución de fuentes y la superposición de resultados en los motores de búsqueda web

Demasiado Largo; Para Leer

El estudio compara los resultados de búsqueda de Google, Bing, DuckDuckGo y Metager y revela que Google muestra dominios más exclusivos en los primeros resultados. Si bien las principales fuentes como Wikipedia y los sitios de noticias dominan en todos los motores, Metager muestra una mayor superposición con Bing. Esto sugiere que el uso de motores de búsqueda alternativos junto con Google puede proporcionar una variedad más amplia de fuentes y perspectivas para los usuarios.
featured image - Una comparación de la distribución de fuentes y la superposición de resultados en los motores de búsqueda web
Browserology: Study & Science of Internet Browsers HackerNoon profile picture
0-item

Autores:

(1) Yagci, Nurce, HAW Hamburgo, Alemania y [email protected];

(2) Sünkler, Sebastian, HAW Hamburgo, Alemania y [email protected];

(3) Häußler, Helena, HAW Hamburgo, Alemania y [email protected];

(4) Lewandowski, Dirk, HAW Hamburgo, Alemania y [email protected].

Tabla de enlaces

Resumen e introducción

Revisión de literatura

Objetivos y preguntas de investigación

Métodos

Resultados

Discusión

Conclusión, datos de investigación, agradecimientos y referencias

ABSTRACTO

Cuando se trata de motores de búsqueda, los usuarios generalmente prefieren Google. Nuestro estudio pretende encontrar las diferencias entre los resultados encontrados en Google respecto a otros buscadores. Comparamos los 10 resultados principales de Google, Bing, DuckDuckGo y Metager, utilizando 3537 consultas generadas por Google Trends de Alemania y EE. UU. Google muestra más dominios exclusivos en los primeros resultados que sus competidores. Wikipedia y los sitios web de noticias son las fuentes más populares en general. Dado que algunas fuentes importantes dominan los resultados de búsqueda, la distribución de dominios también es consistente en todos los motores de búsqueda. La superposición entre Google y Bing siempre está por debajo del 32%, mientras que Metager tiene una mayor superposición con Bing que DuckDuckGo, llegando hasta el 78%. Este estudio muestra que el uso de otro motor de búsqueda, especialmente además de Google, proporciona una variedad más amplia de fuentes y puede llevar al usuario a encontrar nuevas perspectivas.

PALABRAS CLAVE

Búsqueda Web; buscador; raspado web; Google; comparación de fuentes

INTRODUCCIÓN

¿Por qué debería haber más de un motor de búsqueda? Si bien los usuarios pueden preferir un motor de búsqueda sobre otros por su usabilidad, características especializadas o una integración más conveniente en su entorno técnico, la pregunta que nos interesa en esta investigación es si un usuario se beneficiará al usar otro motor de búsqueda además de Google cuando se trata de para encontrar resultados de diferentes fuentes. Nuestro punto de partida es el hecho de que Google es con diferencia el motor de búsqueda más utilizado (StatCounter, 2022), ese usuario confía en gran medida en los motores de búsqueda para que le proporcionen resultados relevantes y útiles (Comisión Europea, 2016; Purcell et al., 2012), y que solo algunos usuarios utilizan otro buscador además de Google (Schultheiß & Lewandowski, 2021).


Los usuarios depositan una gran confianza en los motores de búsqueda. Esto se refleja en el 91% de los usuarios estadounidenses que dijeron que encuentran lo que buscan siempre o la mayor parte del tiempo, y el 66% que cree que los motores de búsqueda son una fuente de información justa e imparcial (Purcell et al., 2012). . Además, el 78% de los usuarios europeos de Internet y plataformas en línea dijeron que confían en que los resultados de sus motores de búsqueda sean los más relevantes (Comisión Europea, 2016). A nivel mundial, los usuarios confían en los motores de búsqueda más que en cualquier otra fuente (incluidos los medios de comunicación tradicionales) cuando se trata de noticias (Edelman Trust Institute, 2022) y los usuarios confían mucho más en las noticias encontradas a través de búsquedas que en las noticias encontradas en las redes sociales.

(Newman et al., 2021).


Como la Web es enorme y diferentes motores de búsqueda pueden preferir diferentes fuentes, es interesante ver si las fuentes principales que se muestran en los resultados de búsqueda difieren de un motor de búsqueda a otro. Podría ser que un motor de búsqueda alternativo prefiera resultados de fuentes "alternativas", por ejemplo, en términos de inclinación política o prefiriendo proveedores de contenido no comerciales. Todo esto se reduce a si los motores de búsqueda alternativos son realmente alternativos en cuanto a los resultados que muestran. Si lo fueran, los posibles beneficios de utilizar un motor de búsqueda distinto de Google incluyen encontrar resultados diferentes, encontrar resultados adicionales y encontrar resultados más relevantes. No importa cuál de estos objetivos pretenda alcanzar un usuario, necesitará resultados distintos a los de Google. Por lo tanto, es interesante ver si otros motores de búsqueda ofrecen a los usuarios estos resultados.


Ha habido un debate en curso sobre los motores de búsqueda alternativos y cómo se puede romper el dominio de Google en el mercado de los motores de búsqueda. Los enfoques van desde el establecimiento de motores de búsqueda alternativos únicos hasta la construcción de infraestructuras para dichas alternativas (por ejemplo, Lewandowski, 2019); ver también Mager, 2014). Dado que Google domina el mercado de los motores de búsqueda (StatCounter, 2022), a menudo parece que no hay ninguna alternativa. Por otro lado, a menudo se sobreestima el número de motores de búsqueda alternativos (o simplemente "otros"). Muchos motores de búsqueda que parecen ser simplemente portales de búsqueda que muestran resultados de un socio en lugar de generar los resultados a partir de su propio índice. Por ejemplo, Yahoo y Ecosia obtienen sus resultados de Bing y, por lo tanto, no pueden considerarse motores de búsqueda por derecho propio. Pero aún así, puede haber otras razones para utilizar un motor de búsqueda sin índice propio. Algunos de los beneficios únicos que anuncian los motores de búsqueda alternativos son la privacidad (por ejemplo, Startpage y DuckDuckGo) o ser una empresa que invierte sus ganancias en proyectos ambientales (por ejemplo, Ecosia). Otro tipo de motor de búsqueda es el metabuscador (por ejemplo, Metager). Un motor de este tipo envía las consultas a varios otros motores de búsqueda y luego agrega y reclasifica los resultados principales. Consideramos especialmente interesante si este enfoque conducirá a una variedad más amplia de resultados de búsqueda, es decir, resultados de un conjunto más diverso de fuentes. Entonces, en el contexto de nuestra investigación, consideraremos cualquier motor de búsqueda que tenga su propio índice o que proporcione una selección única y una reclasificación de los resultados de uno o más índices como un motor de búsqueda alternativo. Estamos especialmente interesados en las diferencias en la distribución de fuentes; la relevancia de los resultados está fuera del alcance de nuestra investigación.


Hace más de 20 años, Introna y Nissenbaum (2000) sostuvieron que los motores de búsqueda, como operaciones comerciales, tienden a preferir sitios web grandes y, por lo tanto, una parte de la Web, es decir, los sitios más pequeños, permanecen ocultos a la vista. Los estudios que miden lo que seleccionan los usuarios parecen confirmarlo: Goel et al. (2010) encontraron que dentro de Yahoo, sólo 10.000 sitios web representan aproximadamente el 80% de los clics en los resultados. Es importante señalar que esto no se debe simplemente a la preferencia del usuario por fuentes particulares, sino que los usuarios seleccionan predominantemente entre los mejores resultados mostrados por el motor de búsqueda. Lo que esté fuera de la vista inmediata de los usuarios no será elegido (Lewandowski & Kammerer, 2021).


Llama la atención que pocos estudios hayan comparado los resultados entre diferentes buscadores en los últimos años. Estudios más antiguos (consulte la sección de revisión de la literatura) encontraron en general que los mejores resultados de diferentes motores de búsqueda no se superponían demasiado. En este artículo, abordamos en qué se diferencian los mejores resultados de Google de las alternativas y, por tanto, si vale la pena que un usuario considere estas alternativas. Si un motor de búsqueda distinto de Google produjera resultados muy similares a los de Google, un usuario no se beneficiaría mucho del uso de ese motor de búsqueda cuando se considera la variedad de fuentes.


Este documento está disponible en arxiv bajo licencia CC 4.0.

Imagen principal de Justin Morgan en Unsplash