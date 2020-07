*Nota: Contactar a Omar Espejel (omar@tsc.ai) para cualquier observación. Cualquier error es responsabilidad del autor.

*Nota: El autor considera que, si bien el escrito está en español y el objetivo es expandir el conocimiento del deep learning en este idioma, existen palabras insustituibles del inglés. Por lo tanto, este y siguientes escritos utilizarán indiscriminadamente palabras en inglés.

Se introduce el tensor como la estructura de datos básica en la creación de deep learning. Usamos pytorch como herramienta para la construcción de tensores capaces de correr en CUDA (GPU). Finalmente, aplicamos manipulación de tensores para hacer broadcasting (transmisión, en español), agregar y quitar dimensiones, y hacer reshaping de nuestras estructuras. Terminamos con una función que utilizaremos más adelante para aplanar imágenes.

En mi opinión, la mejor forma de aprender deep learning es escribir y escribir código. Esto es irrealizable, en terminos de tiempo, si se utiliza el poder de una CPU. Estaremos trabajando en Google Colab donde se nos asigna de manera gratuita por máximo 12 horas un GPU modelo Tesla K80. Solo necesitamos una cuenta de Google.

Rango 1:

Rango 2:

Además, pytorch nos permite hacer indexing de la misma manera que se hace con numpy. No ahondamos en el tema dado que no es tan relevante para iniciar con el deep learning, sin embargo, en la documentación de pytorch se encuentra todo lo necesario.

El broadcasting es una herramienta muy poderosa que nos permite trabajar mejor con tensores sin usar fors. Esta técnica existe también en numpy.

Cuando pytorch opera en dos tensores, compara sus formas en cuanto a elementos. Comienza con las dimensiones finales y avanza.

Estamos escribiendo código que se ejecuta tan rápido como C con esto. Además, el broadcasting nos da velocidad C sin necesidad de memoria adicional. Toma un poco de tiempo acostumbrarse a la forma de codificación de broadcasting, pero, según Jeremy Howard en su clase de practical deep learning, vale la pena ya que reduce muchos errores provenientes de los bucles, y también es más cómodo una vez que nos acostumbramos.

En el texto se utilizarán de forma indiscriminada las palabras "dimensión" y "eje".

Nota: Squeeze hace lo contrario que unsqueeze(); elimina dimensiones.

Nota: reshape() y view() hacen lo mismo.

En este texto, recreé la función de aplanar en el blog para tomar en cuenta los batches (lotes, en español) de datos.

Indiquemos que nuestro tensor es un batch creando una dimensión adicional en la posición 0:

En el siguiente texto comenzaremos con los básicos del deep learning.

