¿Cómo puede Uber entregar comida y llegar siempre a tiempo o unos minutos antes? ¿Cómo relacionan a los pasajeros con los conductores para que siempre puedas encontrar un Uber? ¿Todo eso mientras también administra todos los controladores? Bueno, vamos a responder exactamente eso en el video... Referencias ►Lea el artículo completo: ►Publicación de blog de Uber: ►Qué son los transformadores: ►Transformadores Lineales: ►My Newsletter (¡Una nueva aplicación de IA explicada semanalmente en sus correos electrónicos!): https://www.louisbouchard.ai/uber-deepeta/ https://eng.uber.com/deepeta-how-uber-predicts-arrival-times/ https://youtu.be/sMCHC7XFynM https://arxiv.org/pdf/2006.16236.pdf https://www.louisbouchard.ai/newsletter/ Transcripción de vídeo 0:00 ¿Cómo puede Uber entregar comida y siempre? 0:02 llegar a tiempo o unos minutos antes 0:05 ¿Cómo hacen coincidir a los pasajeros con los conductores para que 0:07 que siempre puedes encontrar un uber todo eso 0:10 mientras que pronto gestionamos todos los controladores que 0:12 responderá estas preguntas en este 0:14 video con su predicción de tiempo de llegada 0:16 algoritmo profundo eta profundo eta es de uber 0:20 algoritmo más avanzado para estimar 0:22 tiempos de llegada usando aprendizaje profundo usado 0:25 tanto para uber como para uber eats deep eta can 0:28 organizar mágicamente todo en el 0:30 fondo para que los pilotos, conductores y 0:32 los alimentos van con fluidez del punto a al 0:34 punto b de la manera más eficiente posible muchas 0:37 existen diferentes algoritmos para estimar 0:40 viajo en esas redes de carreteras, pero yo no 0:42 creo que alguno está tan optimizado como el de uber 0:45 herramientas de predicción de tiempo de llegada anterior 0:47 incluyendo uber fueron construidos con lo que 0:50 llamar a los algoritmos de ruta más corta que son 0:52 no es muy adecuado para el mundo real 0:54 predicciones ya que no consideran 0:56 señales en tiempo real durante varios años uber 0:59 usó xgboost un gradiente conocido 1:02 árbol de decisiones impulsado por aprendizaje automático 1:04 la biblioteca xjboost es extremadamente poderosa 1:07 y utilizado en muchas aplicaciones, pero fue 1:09 limitado en el caso de uber ya que cuanto más 1:11 crecía cuanto más latencia tenía querían 1:14 algo mas rapido mas preciso y mas 1:16 general para ser utilizado por los conductores jinetes 1:18 y comida a domicilio todo ortogonal 1:20 Desafíos complejos de resolver 1:22 incluso para aprendizaje automático o IA 1:25 aquí viene profundo eta un aprendizaje profundo 1:28 modelo que mejora los impulsos xg para 1:30 todos esos oh y casi lo olvido 1:33 aqui esta el patrocinador de este video 1:36 yo por favor tómate un minuto para suscribirte 1:39 si te gusta el contenido y deja tu like 1:41 También me encantaría leer tus pensamientos en 1:43 los comentarios o unirse a la discordia 1:45 comunidad aprende ai juntos para chatear con 1:47 nosotros volvamos al video 1:49 deep eta es realmente poderoso y 1:51 eficiente porque no requiere simplemente 1:53 datos y generar una predicción hay un 1:56 todo el sistema de preprocesamiento para hacer esto 1:58 datos más digeribles para el modelo este 2:00 hace que sea mucho más fácil para el modelo, ya que 2:02 puede enfocarse directamente en datos optimizados 2:05 con mucho menos ruido y mucho más pequeño 2:07 entradas un primer paso en la optimización para 2:10 la latencia emite este preprocesamiento 2:12 El módulo comienza tomando datos del mapa y 2:14 mediciones de tráfico en tiempo real para 2:16 producir un tiempo estimado inicial de 2:18 llegada para cualquier nueva solicitud de cliente 2:21 entonces el modelo toma estos 2:23 características transformadas con el espacio 2:25 origen y destino y hora de la 2:27 solicitud como una característica temporal pero 2:29 no se queda aquí también se necesita más 2:32 información sobre actividades en tiempo real 2:34 como el clima del tráfico o incluso la naturaleza 2:36 de la solicitud como entrega o viaje 2:39 compartir recogida toda esta información adicional 2:41 es necesario mejorar desde el 2:43 algoritmos de ruta más corta que mencionamos 2:45 que son altamente eficientes pero lejos de 2:47 inteligentes son prueba del mundo real y 2:50 que tipo de arquitectura hace esto 2:52 modelo uso adivinaste un transformador 2:54 ¿Estás sorprendido porque definitivamente estoy 2:56 no y esto responde directamente a la primera 2:59 reto que era hacer la maqueta 3:01 más preciso ya he cubierto 3:03 transformadores numerosas veces en mi 3:04 canal así que no entraré en cómo funciona 3:07 en este video pero aún quería 3:08 destacar algunas características específicas para 3:11 este en particular primero debes ser 3:13 pensando pero los transformadores son enormes y 3:16 modelos lentos como puede ser de menor 3:18 latencia que xg boost bien serás 3:21 cierto lo han probado y era demasiado 3:23 lento por lo que tuvieron que hacer algunos cambios 3:26 el cambio con mayor impacto fue 3:28 usar un transformador lineal que escala 3:30 con la dimensión de la entrada en su lugar 3:33 de la longitud de la entrada, esto significa que si 3:35 la entrada es larga los transformadores serán 3:38 muy lento y esto es a menudo el caso de 3:40 ellos con tanta información como el enrutamiento 3:42 los datos en su lugar se escalan con dimensiones 3:45 algo que pueden controlar que es mucho 3:47 más pequeño otra gran mejora en 3:49 la velocidad es la discretización de las entradas 3:52 lo que significa que toman valores continuos 3:53 y hacerlos mucho más fáciles de calcular por 3:56 agrupar valores similares juntos 3:58 la discretización se usa regularmente en 4:00 predicción para acelerar el cálculo como 4:02 la velocidad que da supera claramente la 4:04 error que puede traer valores duplicados 4:07 ahora queda un desafío por cubrir 4:10 y, con mucho, lo más interesante es cómo 4:13 lo hicieron más general aquí está el 4:15 modelo eta profundo completo para responder a esto 4:18 pregunta hay la anterior 4:19 cuantificación de los datos que luego son 4:22 incrustado y enviado al lineal 4:24 transformador que acabamos de discutir, entonces 4:26 tener la capa completamente conectada para hacer 4:28 nuestras predicciones y tenemos un paso final 4:31 para hacer nuestro modelo general el sesgo 4:33 decodificador de ajuste que tomará en el 4:36 predicciones y las características de tipo que 4:38 mencionado al principio del video 4:40 que contiene la razón por la cual el cliente hizo 4:42 una solicitud a uber para una predicción de renderizado 4:44 a un valor más apropiado para una tarea 4:46 periódicamente se reentrenan y despliegan 4:49 su modelo usando su propia plataforma 4:51 llamado michelangelo que me encantaría 4:53 cubra a continuación si está interesado si es así 4:56 por favor hágamelo saber en los comentarios y 4:58 voila esto es lo que uber usa actualmente en 5:01 su sistema para entregar y dar paseos 5:03 a todos de la manera más eficiente posible 5:07 por supuesto, esto fue solo una descripción general y 5:09 utilizaron más técnicas para mejorar la 5:11 arquitectura que puedes conocer en 5:13 su gran publicación de blog vinculada a continuación si 5:16 tienes curiosidad yo también solo quería 5:18 Tenga en cuenta que esto fue solo una descripción general de 5:20 su algoritmo de predicción de la hora de llegada 5:22 y de ninguna manera estoy afiliado a uber 5:25 espero que hayan disfrutado el video de esta semana 5:28 cubriendo un modelo aplicado a lo real 5:30 mundo en lugar de un nuevo trabajo de investigación 5:32 y si es así, siéntase libre de sugerir 5:35 cualquier aplicación o herramienta interesante para 5:37 portada a continuación, me encantaría leer sus identificaciones 5:39 gracias por mirar y voy a ver 5:41 la semana que viene con otro papel increíble [Música]