paint-brush
15 conjuntos de datos de Excel para principiantes en análisis de datospor@datasets
262,171 lecturas
262,171 lecturas

15 conjuntos de datos de Excel para principiantes en análisis de datos

Demasiado Largo; Para Leer

Excel es una herramienta indispensable para el análisis de datos y, con los conjuntos de datos y las técnicas correctos, los principiantes pueden aprender a descubrir ideas y tomar decisiones informadas. En este artículo, hemos compilado una lista de 15 conjuntos de datos de Excel para principiantes en análisis de datos. Estos conjuntos de datos de Excel que cubren temas como análisis financiero, análisis de mercado y análisis de series temporales se pueden utilizar para obtener información sobre escenarios del mundo real.
featured image - 15 conjuntos de datos de Excel para principiantes en análisis de datos
Open Datasets Compiled by HackerNoon HackerNoon profile picture

Excel es una herramienta indispensable para el análisis de datos y, con los conjuntos de datos y las técnicas correctos, los principiantes pueden aprender a descubrir ideas y tomar decisiones informadas. Su interfaz intuitiva y su potente funcionalidad permiten a los usuarios realizar una amplia gama de procesos, como la manipulación de datos, la visualización de datos y el análisis estadístico.

¿Qué son los "conjuntos de datos de Excel"?

Los conjuntos de datos de Excel son colecciones de datos que se almacenan y organizan en una hoja de cálculo de Excel, que es un software de uso común que permite a los usuarios crear, manipular y analizar datos en un formato estructurado. Estos conjuntos de datos pueden venir en dos formatos principales: Excel (.xlsx) y valores separados por comas (CSV). El formato Excel proporciona funciones más avanzadas para organizar y analizar datos complejos, incluido el uso de fórmulas y visualizaciones, mientras que CSV, por otro lado, ofrece un formato más simple que es compatible con una amplia gama de aplicaciones de software, lo que facilita compartir datos entre diferentes programas.


En este artículo, hemos compilado una lista de 15 conjuntos de datos de Excel para principiantes en análisis de datos . Con estos conjuntos de datos de Excel que cubren temas como análisis financiero, análisis de mercado y análisis de series temporales, los principiantes pueden practicar técnicas de análisis de datos como la limpieza de datos, tablas dinámicas y gráficos mientras obtienen información sobre escenarios del mundo real.

Lista de conjuntos de datos de Excel para principiantes en análisis de datos

  1. Ventas de supermercados
  2. Iris
  3. Titánico
  4. Calidad del Vino
  5. Ingresos del censo de adultos
  6. Boston Vivienda
  7. Conjunto de datos de Wisconsin sobre el cáncer de mama
  8. Compradores en línea Intención de compra
  9. Mercadotecnia Bancaria
  10. Precios del aguacate
  11. Amazon Top 50 libros más vendidos 2009 - 2019
  12. FIFA Copa del Mundo
  13. Datos abiertos de Airbnb en la ciudad de Nueva York
  14. Informe mundial de la felicidad
  15. Precio de mercado

1. Ventas de supermercados

Los datos de Superstore Sales proporcionan datos de ventas para una empresa minorista ficticia, incluida información sobre productos, pedidos y clientes. A menudo se utiliza para practicar el análisis de datos.


Este conjunto de datos de Excel incluye las siguientes variables:


  • ID de pedido: un identificador único para cada pedido.
  • ID de cliente: un identificador único para cada cliente.
  • Fecha de pedido: la fecha de colocación del pedido.
  • Fecha de envío: la fecha en que se envió el pedido.
  • Modo de envío: el modo de envío del pedido (por ejemplo, estándar, el mismo día).
  • Segmento: el segmento de clientes (p. ej., Consumidor, Corporativo, Oficina doméstica).
  • Región: la región donde se encuentra el cliente (p. ej., Oeste, Centro, Este).
  • Categoría: la categoría del producto comprado (p. ej., Mobiliario, Tecnología, Suministros de oficina).
  • Subcategoría: la subcategoría del producto comprado (p. ej., sillas, escritorios, papel).
  • Nombre del producto: el nombre del producto comprado.
  • Ventas: los ingresos por ventas del producto comprado.
  • Cantidad - El número de unidades del producto comprado.
  • Descuento - El descuento aplicado al producto comprado.
  • Beneficio - El beneficio generado por el producto adquirido.


2. Iris

Este conjunto de datos incluye medidas de la longitud del sépalo, el ancho del sépalo, la longitud del pétalo y el ancho del pétalo de 150 flores de iris, que pertenecen a 3 especies diferentes: setosa, versicolor y virginica. El conjunto de datos del iris tiene 150 filas y 5 columnas, que se almacenan como un marco de datos, incluida una columna para la especie de cada flor.


La descripción de sus variables incluye:


  • Sepal.Length - La longitud del sépalo representa la longitud del sépalo en centímetros.
  • Sépalo.Ancho - El sépalo.ancho representa el ancho del sépalo en centímetros.
  • Petal.Length: petal.length representa la longitud del pétalo en centímetros.
  • Especie - La variable especie representa la especie de la flor del iris, con tres valores posibles: setosa, versicolor y virginica.


Un caso de uso del conjunto de datos de Iris en Excel es analizar la relación entre las diferentes características de la flor de Iris y clasificar las especies de flores en función de los valores de las características. Esto se puede hacer utilizando técnicas como el análisis de correlación, las estadísticas inferenciales y el modelado predictivo.


También puede descargar este conjunto de datos de Excel en Kaggle haciendo clic en aquí .

3. Titánico

Este popular conjunto de datos de código abierto ofrece información sobre los pasajeros a bordo del barco Titanic cuando se hundió el 15 de abril de 1912. Puede ser utilizado por principiantes en análisis de datos interesados en la limpieza y el preprocesamiento de datos, estadísticas descriptivas, visualización de datos y modelado predictivo.

Algunas de las variables incluidas en el conjunto de datos:


  • PassengerId: un identificador único para cada pasajero.
  • Sobrevivió: muestra si el pasajero sobrevivió o no (0 = No, 1 = Sí).
  • Pclass - Clase de un pasajero (1 = 1°, 2 = 2°, 3 = 3°).
  • Nombre: el nombre de un pasajero.
  • Sexo: el sexo de un pasajero.
  • Edad - La edad de un pasajero.
  • SibSp - El número de hermanos/cónyuges a bordo.
  • Parch - El número de padres/hijos a bordo.
  • Boleto - El número de boleto.
  • Tarifa - La tarifa pagada por el boleto.
  • Cabina - El número de cabina.
  • Embarcado - El puerto de embarque (C = Cherburgo, Q = Queenstown, S = Southampton).

4. Calidad del Vino

El conjunto de datos Wine Quality contiene información sobre muestras de vino tinto y blanco. Este conjunto de datos tiene como objetivo clasificar la calidad del vino en función de propiedades químicas como el pH, la densidad, el contenido de alcohol y el contenido de ácido cítrico.


Las variables comunes incluidas en este conjunto de datos de Excel:


  • Acidez Fija - El número de ácidos fijos en el vino, expresado en g/dm^3.
  • Acidez volátil: el número de ácidos volátiles en el vino, expresado en g/dm^3.
  • Ácido cítrico - La cantidad de ácido cítrico en el vino, expresada en g/dm^3.
  • Azúcar residual: la cantidad de azúcar residual en el vino, expresada en g/dm^3
  • Cloruros - La cantidad de cloruro en el vino, expresada en g/dm^3.
  • Dióxido de azufre libre: la cantidad de dióxido de azufre libre en el vino, expresada en mg/dm^3.
  • Dióxido de azufre total: la cantidad de dióxido de azufre total en el vino, expresada en mg/dm^3.
  • Densidad - La densidad del vino, expresada en g/cm^3.
  • pH - El nivel de pH del vino.
  • Sulfatos - El número de sulfatos en el vino, expresado en g/dm^3.
  • Alcohol - El grado alcohólico del vino, expresado en % vol.
  • Calidad - La calificación de calidad del vino, en una escala de 0 a 10.

5. Ingresos del censo de adultos

Este conjunto de datos de Excel es una recopilación de información sobre las personas que viven en los Estados Unidos, extraída de la base de datos del censo de 1994. Contiene varios atributos demográficos, sociales y económicos sobre cada individuo.


Algunos de los atributos incluidos en este conjunto de datos:


  • edad

  • Clase de trabajo: privado, autónomo, no incluido, autónomo, incluido, gobierno federal, gobierno local, gobierno estatal, sin sueldo, nunca trabajado.

  • fnlwgt

  • Educación: licenciatura, algo de universidad, 11.°, graduación de HS, escuela profesional, Assoc-acdm, Assoc-voc, 9.°, 7.° a 8.°, 12.°, maestría, 1.° a 4.°, 10.°, doctorado, 5.° a 6.°, preescolar.

  • Educación-num

  • estado civil: casado-civ-cónyuge, divorciado, nunca casado, separado, viudo, casado-cónyuge-ausente, casado-AF-cónyuge.

  • ocupación: soporte técnico, reparación artesanal, otros servicios, ventas, gestión ejecutiva, especialidad profesional, manipuladores de limpieza, inspección de máquinas, administración administrativa, agricultura y pesca, transporte y mudanzas, casa privada. serv, Servicio de protección, Fuerzas Armadas.

  • parentesco: esposa, hijo propio, esposo, fuera de la familia, otro pariente, soltero.

  • raza - Blanco, Asiático-Pac-Isleño, Amer-Indio-Esquimal, Otro, Negro.

  • sexo - Masculino o femenino.


El atributo "ingresos" es la variable de destino y el conjunto de datos es muy útil para los principiantes en análisis de datos.


6. Boston Vivienda

El conjunto de datos de Vivienda de Boston consta de información sobre viviendas en el área de Boston, Massachusetts. Tiene alrededor de 506 filas y 14 columnas de datos.


Algunas de las variables en el conjunto de datos incluyen:


  • CRIM - Tasa de criminalidad per cápita por ciudad.
  • ZN - La proporción de suelo residencial zonificado para lotes de más de 25,000 pies cuadrados.
  • INDUS - La proporción de acres comerciales no minoristas por ciudad.
  • CHAS: variable ficticia del río Charles (= 1 si el tramo limita con el río; 0 en caso contrario).
  • NOX - La concentración de óxido nítrico (partes por 10 millones).
  • RM - Número medio de habitaciones por vivienda.
  • EDAD: la proporción de unidades ocupadas por sus propietarios construidas antes de 1940.
  • DIS - Las distancias ponderadas a cinco centros de empleo de Boston.
  • RAD - El Índice de accesibilidad a las carreteras radiales.
  • IMPUESTO - La tasa de impuesto a la propiedad de valor total por cada $10,000.
  • PTRATIO - Ratio alumno-profesor por municipio.
  • B - 1000(Bk - 0.63)^2 donde -Bk es la proporción de negros por ciudad.
  • LSTAT - El estado porcentual más bajo de la población.
  • MEDV: el valor medio de las viviendas ocupadas por sus propietarios en miles de dólares.


Este conjunto de datos se puede utilizar en el análisis de datos para analizar la relación entre varias características de los precios de la vivienda y un mercado inmobiliario, realizar análisis de datos y generar información.

7. Conjunto de datos de Wisconsin sobre el cáncer de mama

Este conjunto de datos de Excel consta de información sobre tumores de cáncer de mama y fue creado inicialmente por el Dr. William H. Wolberg. El conjunto de datos se creó para ayudar a los investigadores y profesionales del aprendizaje automático a clasificar los tumores como malignos (cancerosos) o benignos (no cancerosos).


Algunas de las variables incluidas en este conjunto de datos:


  • número de identificación
  • Diagnóstico (M = maligno, B = benigno).
  • Radio (la media de las distancias desde el centro hasta los puntos del perímetro).
  • Textura (la desviación estándar de los valores de la escala de grises).
  • Perímetro
  • Área
  • Suavidad (la variación local en las longitudes de los radios).
  • Compacidad (el perímetro^2 / área - 1.0).
  • Concavidad (la severidad de las porciones cóncavas del contorno).
  • Puntos cóncavos (el número de porciones cóncavas del contorno).
  • Simetría
  • Dimensión fractal ("aproximación a la línea de costa" - 1).

8. Compradores en línea Intención de compra

El conjunto de datos de intención de compra de los compradores en línea es una recopilación de datos relacionados con los patrones de compra y el comportamiento del consumidor en el contexto de las compras en línea. Fue creado mediante la realización de encuestas a compradores en línea y la recopilación de datos de sus respuestas.


Algunas de las variables en este conjunto de datos incluyen:


  • Administrativo: el número de páginas del sitio web visitadas por el usuario con fines administrativos
  • Administration_Duration: el tiempo total que pasa el usuario en las páginas administrativas del sitio web
  • Informativo: el número de páginas del sitio web visitadas por el usuario con fines informativos
  • Informational_Duration: el tiempo total que pasa el usuario en las páginas informativas del sitio web
  • ProductRelated: la cantidad de páginas del sitio web visitadas por el usuario con fines relacionados con el producto
  • ProductRelated_Duration: el tiempo total que pasa el usuario en las páginas del sitio web relacionadas con el producto.
  • BounceRates: el porcentaje de visitantes que ingresan al sitio web y se van sin ver ninguna otra página
  • ExitRates: el porcentaje de visitantes que salen del sitio web desde una página en particular después de visitarla
  • PageValues: el valor promedio de las páginas vistas por el usuario antes de la transacción
  • SpecialDay: la proximidad de la visita a un día especial (por ejemplo, el Día de la Madre, el Día de San Valentín, etc.)


Este conjunto de datos de Excel se utiliza en investigaciones y análisis relacionados con el comercio electrónico y el marketing en línea. Puede ayudar a las empresas a comprender los factores que impulsan el comportamiento del cliente y también es útil para los principiantes en análisis de datos.

9. Mercadotecnia Bancaria

Este popular conjunto de datos es para estudiar campañas de marketing para una institución bancaria portuguesa. Contiene información sobre las campañas de marketing del banco, así como datos demográficos e indicadores económicos de los clientes.


Algunas de las variables incluidas en este conjunto de datos:


  • Edad - Edad del cliente (numérico)
  • Trabajo - Tipo de trabajo
  • Civil - Estado civil
  • Educación - Nivel de educación
  • Incumplimiento - ¿Tiene el crédito en incumplimiento?
  • Saldo - Saldo medio anual, en euros.
  • Vivienda - ¿Tiene un préstamo de vivienda?
  • Préstamo - Tiene un préstamo personal?
  • Contacto - Tipo de comunicación de contacto.
  • Día - Día del mes contactado.
  • La variable de salida indica si el cliente suscribió o no un depósito a plazo después de ser contactado por el banco.

10 Precios del aguacate

El conjunto de datos de precios del aguacate consta de datos relacionados con los precios de los aguacates en los Estados Unidos. Los datos se recopilan de varias fuentes, como la Junta de Aguacate Hass y el Departamento de Agricultura de los Estados Unidos (USDA).


Algunas de las variables en este conjunto de datos incluyen:


  • Fecha - La fecha de la observación.
  • AveragePrice: el precio promedio de un solo aguacate.
  • Volumen Total - Número total de aguacates vendidos.
  • Código de PLU (búsqueda de precio): un código que se utiliza para identificar un tipo específico de aguacate.
  • Tipo - Convencional u orgánico
  • Región: la ciudad o región de la observación.


También puede ser utilizado por empresas de la industria alimentaria para tomar decisiones estratégicas sobre la compra y venta de aguacates.

11 Amazon Top 50 libros más vendidos 2009 - 2019

Este conjunto de datos de Excel es una colección de datos relacionados con los 50 libros más vendidos en Amazon para cada año entre 2009 y 2019.


El conjunto de datos incluye las siguientes variables:


  • Nombre - El título del libro.
  • Autor: el nombre del autor del libro.
  • Calificación del usuario: la calificación promedio del libro proporcionada por los usuarios de Amazon.
  • Reseñas: el número total de reseñas que ha recibido el libro en Amazon.
  • Precio: el precio del libro en dólares estadounidenses.
  • Año: el año en que se publicó el libro.
  • Género - El género del libro.


Los 50 libros más vendidos de Amazon se pueden utilizar para explorar las tendencias en las ventas de libros en Amazon durante una década y es útil para los principiantes en análisis de datos.


12 FIFA Copa del Mundo

El conjunto de datos de la Copa Mundial de la FIFA es una recopilación de datos relacionados con la Copa Mundial de la FIFA que se celebra cada cuatro años. Contiene información sobre todos los torneos de la Copa del Mundo desde 1930 hasta 2014.


Algunas de las variables en este conjunto de datos incluyen:


  • Año - El año del torneo.
  • País - El país anfitrión del torneo.
  • Ganador - El equipo que ganó el torneo.
  • Subcampeones: el equipo que terminó como subcampeón.
  • Tercero - El equipo que terminó en tercer lugar.
  • Cuarto - El equipo que terminó en cuarto lugar.
  • GoalsScored: el número total de goles marcados en el torneo.
  • QualifiedTeams: el número total de equipos que se clasificaron para el torneo.
  • Asistencia - El número total de espectadores que asistieron a los partidos.


El conjunto de datos se puede utilizar para analizar tendencias en la Copa del Mundo a lo largo del tiempo, como cambios en la cantidad de equipos que participan o la cantidad de goles marcados.

13 Datos abiertos de Airbnb en la ciudad de Nueva York

Este conjunto de datos de Excel consta de información pública sobre listados y métricas de Airbnb en la ciudad de Nueva York. Los datos abiertos de Airbnb de la ciudad de Nueva York de 2019 incluyen información sobre aproximadamente 50 000 listados de Airbnb en la ciudad y el gobierno de la ciudad de Nueva York los pone a disposición del público para promover la transparencia y la comprensión del impacto de los alquileres en la ciudad.


Algunas de las variables en el conjunto de datos incluyen:


  • Id: un identificador único para cada listado de Airbnb.
  • Nombre: el nombre de la lista de Airbnb.
  • Host_id: un identificador único para el anfitrión de Airbnb.
  • Host_name: el nombre del anfitrión de Airbnb.
  • Neighborhood_group: el distrito de la ficha de Airbnb.
  • Vecindario: el vecindario de la ficha de Airbnb.
  • Latitud: la latitud de la lista de Airbnb.
  • Longitud - La longitud de la lista de Airbnb.
  • Room_type: el tipo de habitación disponible para alquilar (p. ej., habitación privada, casa/apto. completo, habitación compartida).
  • Precio: el precio por noche para alquilar el listado de Airbnb.

14 Informe mundial de la felicidad

Este conjunto de datos incluye información sobre los niveles de felicidad de más de 150 países, como los factores económicos, sociales y de salud que contribuyen a la felicidad. Es útil para los principiantes en análisis de datos para practicar la exploración, visualización y análisis de regresión de datos.


Algunas de las variables en este conjunto de datos incluyen:


  • Nombre del país - Nombre del país.
  • Año - Año de la encuesta.
  • Life Ladder: puntaje promedio de satisfacción con la vida basado en una escala de 0 a 10.
  • Log GDP per cápita - Logaritmo natural del PIB per cápita, ajustado por paridad de poder adquisitivo (PPA) en dólares internacionales constantes de 2017.
  • Esperanza de vida saludable al nacer: el número esperado de años para vivir con plena salud, ajustado por los años pasados con mala salud.

15. Precio de mercado

Este conjunto de datos incluye los precios diarios de las acciones de varias empresas, como Apple, Google y Amazon. Es útil para practicar el análisis de series temporales y predecir los precios futuros de las acciones.


Las variables en este conjunto de datos:


  • Fecha: la fecha en que se registró el precio de las acciones.
  • Apertura - El precio de apertura de la acción.
  • Máximo: el precio más alto de la acción durante el día de negociación.
  • Mínimo: el precio más bajo de la acción durante el día de negociación.
  • Cerrar - El precio de cierre de la acción.
  • Adj Close - El precio de cierre ajustado de la acción.
  • Volumen - El número de acciones negociadas durante el día.


Preguntas de práctica común para estos conjuntos de datos de Excel

Ventas de supermercados

  • ¿Cuál es el ingreso total generado por la tienda?
  • ¿Qué categoría de productos contribuye más a las ventas?
  • ¿Cómo ha sido la tendencia de las ventas durante el último año?
  • ¿Qué región tiene las ventas más altas y cuál tiene las más bajas?
  • ¿Cuál es el margen de utilidad promedio de la tienda?

Iris

  • ¿Cuál es la distribución de cada especie de iris en el conjunto de datos?
  • ¿Cuál es la correlación entre la longitud y el ancho de los pétalos?
  • ¿Cuál es la longitud promedio del sépalo para cada especie de iris?
  • ¿Qué especie de iris tiene el área de pétalos más grande?
  • ¿Cuántas observaciones hay para cada especie de iris?

Titánico

  • ¿Cuál es la tasa de supervivencia de los pasajeros?
  • ¿Cuál es la edad promedio de los pasajeros?
  • ¿Cuál es la proporción de pasajeros hombres y mujeres?
  • ¿Qué clase de pasajeros tuvo la tasa de supervivencia más alta?
  • ¿Cuál es la distribución de la tarifa pagada por los pasajeros?

Calidad del Vino

  • ¿Cuál es la correlación entre el pH y el contenido de alcohol?
  • ¿Qué tipo de vino (tinto o blanco) tiene una calificación media de calidad más alta?
  • ¿Cuál es la acidez volátil mediana para cada tipo de vino?
  • ¿Cuál es la proporción de cada tipo de vino en el conjunto de datos?
  • ¿Cuál es la distribución de ácido cítrico para cada tipo de vino?

Ingresos del censo de adultos

  • ¿Cuál es la proporción de personas que ganan más de $50K?
  • ¿Cuál es la edad promedio de las personas que ganan más de $50K?
  • ¿Cuál es la correlación entre la edad y el nivel educativo?
  • ¿Cuál es la proporción de hombres y mujeres que ganan más de $50K?
  • ¿Cuál es la mediana de horas trabajadas por semana para las personas que ganan más de $50K?

Boston Vivienda

  • ¿Cuál es la correlación entre el número de habitaciones y el valor medio de las viviendas ocupadas por sus propietarios?
  • ¿Qué variable tiene la correlación más alta con el valor mediano de las viviendas ocupadas por sus propietarios?
  • ¿Cuál es la edad promedio de las viviendas?
  • ¿Cuál es la distribución de la razón alumno-maestro por ciudad?
  • ¿Qué ciudad tiene el valor medio más alto de viviendas ocupadas por sus propietarios?

Conjunto de datos de Wisconsin sobre el cáncer de mama

  • ¿Cuál es la proporción de tumores benignos y malignos?
  • ¿Cuál es la correlación entre el radio y el perímetro del tumor?
  • ¿Cuál es la suavidad promedio de los tumores?
  • ¿Cuál es la distribución de la concavidad de los tumores?
  • ¿Cuál es el área mediana de los tumores?

Compradores en línea Intención de compra

  • ¿Cuál es la proporción de visitantes que realizaron una compra?
  • ¿Cuál es la distribución del número de páginas visitadas por los visitantes?
  • ¿Cuál es el tiempo promedio que los visitantes pasan en el sitio web?
  • ¿Cuál es la correlación entre la tasa de rebote y los ingresos?
  • ¿Cuál es la distribución del sistema operativo utilizado por los visitantes?

Mercadotecnia Bancaria

  • ¿Cuál es la proporción de personas que suscribieron un depósito a plazo?
  • ¿Cuál es la correlación entre la edad y el equilibrio?
  • ¿Cuál es la distribución del tipo de trabajo de los clientes?
  • ¿Cuál es la duración media de las llamadas?
  • ¿Cuál es la proporción de llamadas realizadas cada mes?

Amazon Top 50 libros más vendidos 2009 - 2019

  • ¿Cuál es la calificación promedio de los libros?
  • ¿Cuál es la distribución del número de reseñas que reciben los libros?
  • ¿Qué libro tiene el precio más alto?
  • ¿Cuál es la correlación entre la calificación y el precio de los libros?
  • ¿Cuál es la distribución de los géneros de los libros?

FIFA Copa del Mundo

  • ¿Cuál es el promedio de goles marcados por partido?
  • ¿Cuál es la proporción de juegos que terminaron en empate?
  • ¿Qué país ha ganado más títulos de la Copa del Mundo?
  • ¿Cuál es la edad promedio de los jugadores en el torneo?
  • ¿Cuál es la distribución de asistencia para cada partido?

Datos abiertos de Airbnb en la ciudad de Nueva York

  • ¿Cuál es el precio medio de los anuncios?
  • ¿Cuál es la distribución de los tipos de habitaciones disponibles para los listados?
  • ¿Qué barrio tiene más listados?
  • ¿Cuál es la correlación entre el número de reseñas y el precio de los listados?
  • ¿Cuál es la distribución de las políticas de cancelación de los listados?

Informe mundial de la felicidad

  • ¿Cuál es la distribución de las puntuaciones de felicidad de cada país?
  • ¿Qué país tiene la puntuación de felicidad más alta?
  • ¿Cuál es la correlación entre el PIB per cápita y la puntuación de felicidad?
  • ¿Cuál es la distribución de los factores que contribuyen a la felicidad?
  • ¿Qué región del mundo tiene el puntaje promedio más alto de felicidad?

Precio de mercado

  • ¿Cuál es el rendimiento promedio diario de la acción?
  • ¿Cuál es la distribución del volumen diario de negociación? Precios del aguacate
  • ¿Cuál es el precio promedio de los aguacates?
  • ¿Cuál es la distribución del precio promedio por región?
  • ¿Qué región tiene el precio promedio más alto y más bajo?
  • ¿Cuál es la correlación entre el volumen total y el precio medio?
  • ¿Cuál es la distribución del volumen total por año?

Pensamientos finales

Excel ofrece una amplia gama de herramientas para principiantes en análisis de datos y puede mejorar sus habilidades utilizando los conjuntos de datos de Excel que se enumeran en este artículo.


También puede crear varios tipos de visualizaciones, como gráficos de líneas, gráficos de barras, diagramas de dispersión, histogramas y gráficos circulares para responder a las preguntas anteriores.


La imagen principal de este artículo se generó a través del modeloAI Stable Diffusion de HackerNoon utilizando el mensaje 'Conjuntos de datos de Excel'.


Más listas de conjuntos de datos:

  1. Conjuntos de datos de Tableau
  2. Conjuntos de datos de Power BI
  3. Conjuntos de datos de Keras