¿Cómo puede Uber entregar comida y llegar siempre a tiempo o unos minutos antes? ¿Cómo relacionan a los pasajeros con los conductores para que siempre puedas encontrar un Uber? ¿Todo eso mientras también administra todos los controladores?
Bueno, vamos a responder exactamente eso en el video...
►Lea el artículo completo: https://www.louisbouchard.ai/uber-deepeta/
►Publicación de blog de Uber: https://eng.uber.com/deepeta-how-uber-predicts-arrival-times/
►Qué son los transformadores:
►Transformadores Lineales: https://arxiv.org/pdf/2006.16236.pdf
►My Newsletter (¡Una nueva aplicación de IA explicada semanalmente en sus correos electrónicos!): https://www.louisbouchard.ai/newsletter/
0:00
¿Cómo puede Uber entregar comida y siempre?
0:02
llegar a tiempo o unos minutos antes
0:05
¿Cómo hacen coincidir a los pasajeros con los conductores para que
0:07
que siempre puedes encontrar un uber todo eso
0:10
mientras que pronto gestionamos todos los controladores que
0:12
responderá estas preguntas en este
0:14
video con su predicción de tiempo de llegada
0:16
algoritmo profundo eta profundo eta es de uber
0:20
algoritmo más avanzado para estimar
0:22
tiempos de llegada usando aprendizaje profundo usado
0:25
tanto para uber como para uber eats deep eta can
0:28
organizar mágicamente todo en el
0:30
fondo para que los pilotos, conductores y
0:32
los alimentos van con fluidez del punto a al
0:34
punto b de la manera más eficiente posible muchas
0:37
existen diferentes algoritmos para estimar
0:40
viajo en esas redes de carreteras, pero yo no
0:42
creo que alguno está tan optimizado como el de uber
0:45
herramientas de predicción de tiempo de llegada anterior
0:47
incluyendo uber fueron construidos con lo que
0:50
llamar a los algoritmos de ruta más corta que son
0:52
no es muy adecuado para el mundo real
0:54
predicciones ya que no consideran
0:56
señales en tiempo real durante varios años uber
0:59
usó xgboost un gradiente conocido
1:02
árbol de decisiones impulsado por aprendizaje automático
1:04
la biblioteca xjboost es extremadamente poderosa
1:07
y utilizado en muchas aplicaciones, pero fue
1:09
limitado en el caso de uber ya que cuanto más
1:11
crecía cuanto más latencia tenía querían
1:14
algo mas rapido mas preciso y mas
1:16
general para ser utilizado por los conductores jinetes
1:18
y comida a domicilio todo ortogonal
1:20
Desafíos complejos de resolver
1:22
incluso para aprendizaje automático o IA
1:25
aquí viene profundo eta un aprendizaje profundo
1:28
modelo que mejora los impulsos xg para
1:30
todos esos oh y casi lo olvido
1:33
aqui esta el patrocinador de este video
1:36
yo por favor tómate un minuto para suscribirte
1:39
si te gusta el contenido y deja tu like
1:41
También me encantaría leer tus pensamientos en
1:43
los comentarios o unirse a la discordia
1:45
comunidad aprende ai juntos para chatear con
1:47
nosotros volvamos al video
1:49
deep eta es realmente poderoso y
1:51
eficiente porque no requiere simplemente
1:53
datos y generar una predicción hay un
1:56
todo el sistema de preprocesamiento para hacer esto
1:58
datos más digeribles para el modelo este
2:00
hace que sea mucho más fácil para el modelo, ya que
2:02
puede enfocarse directamente en datos optimizados
2:05
con mucho menos ruido y mucho más pequeño
2:07
entradas un primer paso en la optimización para
2:10
la latencia emite este preprocesamiento
2:12
El módulo comienza tomando datos del mapa y
2:14
mediciones de tráfico en tiempo real para
2:16
producir un tiempo estimado inicial de
2:18
llegada para cualquier nueva solicitud de cliente
2:21
entonces el modelo toma estos
2:23
características transformadas con el espacio
2:25
origen y destino y hora de la
2:27
solicitud como una característica temporal pero
2:29
no se queda aquí también se necesita más
2:32
información sobre actividades en tiempo real
2:34
como el clima del tráfico o incluso la naturaleza
2:36
de la solicitud como entrega o viaje
2:39
compartir recogida toda esta información adicional
2:41
es necesario mejorar desde el
2:43
algoritmos de ruta más corta que mencionamos
2:45
que son altamente eficientes pero lejos de
2:47
inteligentes son prueba del mundo real y
2:50
que tipo de arquitectura hace esto
2:52
modelo uso adivinaste un transformador
2:54
¿Estás sorprendido porque definitivamente estoy
2:56
no y esto responde directamente a la primera
2:59
reto que era hacer la maqueta
3:01
más preciso ya he cubierto
3:03
transformadores numerosas veces en mi
3:04
canal así que no entraré en cómo funciona
3:07
en este video pero aún quería
3:08
destacar algunas características específicas para
3:11
este en particular primero debes ser
3:13
pensando pero los transformadores son enormes y
3:16
modelos lentos como puede ser de menor
3:18
latencia que xg boost bien serás
3:21
cierto lo han probado y era demasiado
3:23
lento por lo que tuvieron que hacer algunos cambios
3:26
el cambio con mayor impacto fue
3:28
usar un transformador lineal que escala
3:30
con la dimensión de la entrada en su lugar
3:33
de la longitud de la entrada, esto significa que si
3:35
la entrada es larga los transformadores serán
3:38
muy lento y esto es a menudo el caso de
3:40
ellos con tanta información como el enrutamiento
3:42
los datos en su lugar se escalan con dimensiones
3:45
algo que pueden controlar que es mucho
3:47
más pequeño otra gran mejora en
3:49
la velocidad es la discretización de las entradas
3:52
lo que significa que toman valores continuos
3:53
y hacerlos mucho más fáciles de calcular por
3:56
agrupar valores similares juntos
3:58
la discretización se usa regularmente en
4:00
predicción para acelerar el cálculo como
4:02
la velocidad que da supera claramente la
4:04
error que puede traer valores duplicados
4:07
ahora queda un desafío por cubrir
4:10
y, con mucho, lo más interesante es cómo
4:13
lo hicieron más general aquí está el
4:15
modelo eta profundo completo para responder a esto
4:18
pregunta hay la anterior
4:19
cuantificación de los datos que luego son
4:22
incrustado y enviado al lineal
4:24
transformador que acabamos de discutir, entonces
4:26
tener la capa completamente conectada para hacer
4:28
nuestras predicciones y tenemos un paso final
4:31
para hacer nuestro modelo general el sesgo
4:33
decodificador de ajuste que tomará en el
4:36
predicciones y las características de tipo que
4:38
mencionado al principio del video
4:40
que contiene la razón por la cual el cliente hizo
4:42
una solicitud a uber para una predicción de renderizado
4:44
a un valor más apropiado para una tarea
4:46
periódicamente se reentrenan y despliegan
4:49
su modelo usando su propia plataforma
4:51
llamado michelangelo que me encantaría
4:53
cubra a continuación si está interesado si es así
4:56
por favor hágamelo saber en los comentarios y
4:58
voila esto es lo que uber usa actualmente en
5:01
su sistema para entregar y dar paseos
5:03
a todos de la manera más eficiente posible
5:07
por supuesto, esto fue solo una descripción general y
5:09
utilizaron más técnicas para mejorar la
5:11
arquitectura que puedes conocer en
5:13
su gran publicación de blog vinculada a continuación si
5:16
tienes curiosidad yo también solo quería
5:18
Tenga en cuenta que esto fue solo una descripción general de
5:20
su algoritmo de predicción de la hora de llegada
5:22
y de ninguna manera estoy afiliado a uber
5:25
espero que hayan disfrutado el video de esta semana
5:28
cubriendo un modelo aplicado a lo real
5:30
mundo en lugar de un nuevo trabajo de investigación
5:32
y si es así, siéntase libre de sugerir
5:35
cualquier aplicación o herramienta interesante para
5:37
portada a continuación, me encantaría leer sus identificaciones
5:39
gracias por mirar y voy a ver
5:41
la semana que viene con otro papel increíble
[Música]