paint-brush
El momento Minotauro de Microsoftpor@zbruceli
1,395 lecturas
1,395 lecturas

El momento Minotauro de Microsoft

por Bruce Li11m2023/04/20
Read on Terminal Reader

Demasiado Largo; Para Leer

Si bien estoy emocionado y eufórico por la nueva ganancia de productividad de la combinación de OpenAI y GitHub de Microsoft, también me preocupa que una empresa pueda tener tanto poder sobre la totalidad de la inteligencia colectiva de la raza humana. Espero que el joven Teseo pueda tomar la espada de código abierto y luchar por un nuevo camino fuera del laberinto, para que el intelecto de la humanidad pueda prosperar libremente.
featured image - El momento Minotauro de Microsoft
Bruce Li HackerNoon profile picture

El mito del minotauro

El Minotauro de la mitología griega es un ejemplo perfecto de algo que tenía un poder tremendo pero que también tenía una debilidad fatal. El Minotauro era una criatura mitad humana, mitad toro con gran fuerza y ferocidad.


Sin embargo, finalmente fue derrotado por el héroe ateniense Teseo, quien usó la única debilidad fatal de la criatura, su incapacidad para navegar por el laberinto en el que estaba aprisionada, contra ella.


Ahora, averigüemos cómo esta poderosa criatura mítica griega tiene algo que ver con el Microsoft de hoy en día, y cómo pueden los jóvenes emprendedores encontrar formas de luchar contra su poder casi insuperable.

El resurgimiento de Microsoft

El resurgimiento de Microsoft

Cuando Satya Nadella tomó las riendas como director ejecutivo de Microsoft en 2014, heredó una empresa que se enfrentaba al estancamiento y luchaba por competir en el panorama tecnológico en rápida evolución.


Desde entonces, al liderazgo de Nadella se le atribuye la revitalización de Microsoft al cambiar su enfoque de los sistemas operativos tradicionales y el software de productividad a la computación en la nube y la IA.


Un buen ejemplo es la suite de productividad de Office y cómo ha evolucionado tanto antes como después del reinado de Nadella.


Microsoft Office, presentado por primera vez en 1989, se ha convertido en la piedra angular de la productividad y la comunicación en el mundo empresarial.


Como conjunto de aplicaciones de software, inicialmente comprendía Word, Excel y PowerPoint, pero desde entonces ha crecido para incluir otras herramientas como Outlook, Access y Publisher.


Los esfuerzos constantes de Microsoft para mejorar y refinar estas aplicaciones les han permitido mantener una posición dominante en el mercado.


A principios de la década de 2000, Microsoft Office se había convertido en el estándar de la industria para la creación de documentos, la gestión de datos y el diseño de presentaciones, una posición que sigue ocupando en la actualidad.


En 2011, Microsoft presentó Office 365, un cambio significativo en la estrategia comercial de la empresa. Mediante la transición a un modelo de suscripción basado en la nube. Este modelo ayudó a solidificar el dominio de Microsoft en el mercado, al mismo tiempo que creaba un fuerte efecto de bloqueo del cliente.


El modelo de suscripción garantizó un flujo de ingresos constante para Microsoft y alentó a los usuarios a permanecer dentro del ecosistema, ya que el costo de cambiar a soluciones alternativas se volvió más engorroso y menos atractivo.


Pero las ambiciones de Microsoft iban mucho más allá de Office 365 y la computación en la nube de Azure.

Entra el Minotauro

Como recordamos del mito griego, el Minotauro tenía una gran fuerza, sobre todo porque era una criatura híbrida mitad humano y mitad toro. Si pudiéramos hacer una analogía, Microsoft es:


  • Half Human: lenguaje y sabiduría humanos a través de la licencia exclusiva de OpenAI


  • Half Bull: lenguaje informático e inteligencia a través de su propiedad de GitHub


Profundizaremos en cada una de estas mitades igualmente poderosas para un análisis más profundo.

Medio humano - OpenAI y ChatGPT

OpenAI e inteligencia humana


La inversión estratégica de Microsoft y su asociación de licencias exclusivas con OpenAI, el inventor de ChatGPT, ha desempeñado un papel importante en la consolidación de la posición de la empresa como actor dominante en el campo de la IA.


Anunciada en 2019, la asociación ha ayudado a Microsoft a aprovechar la investigación de vanguardia de OpenAI para desarrollar nuevas tecnologías de IA e integrarlas en sus productos y servicios.


Esta colaboración ha impulsado el crecimiento del ecosistema de IA de Microsoft, lo que permite a la empresa ofrecer capacidades impulsadas por IA en todas sus ofertas, incluidos los servicios de IA de Azure, Cortana e incluso las aplicaciones de Office 365.


El gran alcance y la velocidad inusualmente alta de la integración de OpenAI dentro de Office 365, la joya de la corona de la suite de productividad de Microsoft, dice mucho de la importancia estratégica de OpenAI para Microsoft.


Entonces, en cierto modo, Microsoft ahora captura la totalidad del lenguaje humano, el conocimiento y al menos alguna sabiduría inferida (que algunos investigadores de Microsoft llamaron “una chispa de AGI” ). A través de su acuerdo de licencia exclusivo con OpenAI, no tendrá competidores cercanos.


Puede argumentar que Google y Meta podrían desafiar el monopolio de OpenAI/Microsoft, pero sus respectivos modelos de lenguaje grande, Bard y LLaMA, parecen estar al menos una generación atrás.


Además, OpenAI ha evolucionado de una organización sin fines de lucro a una organización con ganancias limitadas. Y existe este divertido tope de ganancias a 100 veces la inversión.


Dado que Microsoft ya ha inyectado y planeado inyectar más de 10 mil millones de dólares en OpenAI, puede asumir con seguridad que OpenAI no se desvinculará de Microsoft en el corto plazo.


Y Microsoft siempre puede “invertir” más dinero en OpenAI en lugar de comprar productos y servicios de OpenAI. Esto perpetuará la simbiosis entre OpenAI y Microsoft.


No sorprende que un grupo de personas muy importantes estén lo suficientemente alarmados como para firmar una petición para detener toda la investigación de IA durante los próximos 6 meses .

Half Bull - GitHub, Codex y Co-Pilot

GitHub y toro digital


La adquisición e integración de GitHub en 2018, una plataforma líder para el desarrollo y la colaboración de software, amplió aún más el control de Microsoft sobre la inteligencia humana en su conjunto.


GitHub es un centro para todos los principales proyectos de código abierto, y puede considerarlo el repositorio agregado de inteligencia humana expresada en un lenguaje informático que ejecuta todo para todos en el mundo actual.


Me gustaría resaltar la importancia del Codex de OpenAI, un modelo de lenguaje avanzado que ha tenido un profundo impacto en el campo del desarrollo de software, particularmente a través de su integración con Copilot de GitHub.


Codex, que forma parte de la familia de modelos GPT-3, es capaz de comprender y generar texto similar al humano, incluido el código de programación.


Su capacidad para interpretar consultas en lenguaje natural y generar fragmentos de código precisos y contextualmente relevantes la ha convertido en una herramienta valiosa para los desarrolladores.


Copilot de GitHub, que aprovecha las capacidades de Codex, sirve como un asistente de codificación impulsado por IA que ayuda a los desarrolladores a escribir código de manera más eficiente al proporcionar sugerencias en tiempo real y completar segmentos de código automáticamente.


La integración de Copilot con Codex ha transformado el proceso de desarrollo de software al reducir el tiempo y el esfuerzo necesarios para escribir código, minimizar los errores y permitir que los desarrolladores se concentren en tareas de resolución de problemas y diseño de alto nivel.


Después de usar GitHub Co-Pilot durante un período prolongado y combinarlo recientemente con ChatGPT v4, recién comencé a darme cuenta de su tremendo poder y su inmenso potencial.


Como gerente de producto y cofundador, ahora puedo conceptualizar una idea, escribir un requisito breve y dejar que ChatGPT escupa un modelo bastante decente.


Luego, en Visual Studio Code con GitHub Co-Pilot, puedo modificar la función y los parámetros cuando sea necesario, ajustar un poco el flujo de control y la lógica comercial, y tengo un prototipo completamente funcional en cuestión de horas.


Dado que no soy un verdadero ingeniero de software en ejercicio, tal creación de prototipos me habría costado 1-2 semanas de tiempo de piratería o rogando a algunos ingenieros de software que trabajaran en ello.


Y no está tan lejos de un verdadero movimiento de desarrollo de software "sin código" que florecerá entre personas que ni siquiera entienden los conceptos básicos de los lenguajes de programación de computadoras existentes.


Para los ingenieros de software experimentados, hay reclamos de mejoras de productividad 3x o incluso 10x a través de la combinación de GitHub Co-Pilot y chatGPT v4.


Estas herramientas pueden fácilmente encontrar los patrones de diseño del gigantesco repositorio de GitHub y encaja en el contexto del sistema de software en el que el desarrollador está trabajando actualmente.


Ahorra muchas búsquedas en Google, reduce la escritura y la verificación de errores, y automatiza una gran parte de la documentación y las pruebas. Un ingeniero incluso lamentó que sintió ganas de perder uno de sus brazos cuando GitHub Co-Pilot estuvo fuera de línea durante unas horas.

El peligro potencial del Minotauro

La misión de Google es "organizar la información del mundo y hacerla universalmente accesible y útil", y lo logra básicamente haciendo un PageRank en todos los sitios web y construyendo un índice gigante para ellos.


Pero con el modelo de lenguaje grande GPT de Microsoft/OpenAI y el códice GitHub, la información del mundo podría condensarse en miles de millones y billones de pesos (números de importancia estadística, en sentido figurado).


Y fue entonces cuando me di cuenta de que habíamos entrado en el momento Minotauro de Microsoft.


La relación profundamente arraigada de Microsoft con OpenAI ha suscitado preocupaciones sobre el potencial de la empresa para utilizar su poder combinado para crear un monopolio en el campo de la inteligencia artificial.


El modelo de lenguaje GPT-4 de OpenAI es uno de los sistemas de IA más potentes del mundo actual, y GitHub es la plataforma de alojamiento de código más grande del mundo.


Si Microsoft usara estas herramientas para sofocar la competencia, podría tener un impacto significativo en el desarrollo de la IA y la industria tecnológica en general.


Es importante tener en cuenta que estas son solo preocupaciones, y no hay evidencia de que Microsoft esté planeando usar su poder combinado de manera monopólica.


Sin embargo, es crucial ser consciente de los peligros potenciales de tal movimiento y asegurarse de que Microsoft no abuse de su poder.

La esperanza de Teseo (y las empresas emergentes)

joven teseo

Innovar a hombros de gigantes

Las empresas emergentes pueden aprovechar las plataformas de las grandes empresas para innovar en nuevos productos aprovechando los recursos, la infraestructura y la base de usuarios que ofrecen estas plataformas. Aquí hay algunos ejemplos de historias de éxito anteriores:


  1. Apple App Store y Google Play Store: al crear aplicaciones en estas plataformas, las nuevas empresas pueden acceder a un amplio mercado de usuarios de teléfonos inteligentes, distribuir fácilmente sus productos y beneficiarse de los sistemas de pago seguros de las tiendas de aplicaciones.


  2. Amazon Web Services (AWS): las empresas emergentes pueden utilizar la infraestructura informática en la nube de AWS para crear y escalar sus aplicaciones, almacenar datos y acceder a herramientas de análisis avanzadas. Esto les permite centrarse en la innovación y el desarrollo de productos sin preocuparse por invertir y administrar su propia infraestructura de TI.


Al aprovechar las plataformas de las grandes empresas, las nuevas empresas pueden obtener acceso a recursos, infraestructura y bases de usuarios que, de otro modo, serían difíciles o costosos de adquirir. Esto les permite centrarse en la innovación y el desarrollo de productos, aumentando las posibilidades de éxito en el mercado competitivo.


Ya estamos siendo testigos de la Explosión Cámbrica de herramientas y soluciones impulsadas por IA. No pasa un solo día sin una ráfaga de anuncios de empresas emergentes aspirantes que combinan GPT de OpenAI con nuevos conjuntos de datos (legales, financieros), otros modelos de IA (reconocimiento de voz, reconocimiento de imágenes), otras soluciones de IA generativa (síntesis de voz, texto a imagen y texto a video), y muchos más.

Busque la ayuda del soberano

Uno de los principales riesgos de desarrollar plataformas de terceros con fines de lucro es que la plataforma puede cambiar, desaparecer o incluso competir con sus propios socios del ecosistema. Un ejemplo es Facebook vs Zynga, mientras que otro ejemplo es la eliminación de diferentes ideologías por parte de las principales redes sociales.


Por lo tanto, los empresarios podrían encontrar ayuda en lugares inusuales: gobiernos y reguladores para frustrar cualquier comportamiento anticompetitivo. Y es posible que puedan aprender una página de las demandas antimonopolio anteriores en el sector de la tecnología.

Jugar el juego al aire libre

Campo abierto


El código abierto ha sido el arma confiable y verdadera para luchar contra los grandes monolitos de código cerrado. Dado que OpenAI ha cerrado sus modelos GPT-3 y GPT-4, Meta hizo un movimiento atípico y abrió su propio modelo de lenguaje grande llamado LLaMA con fines de investigación.


Este es, con mucho, el LLM de código abierto más avanzado, con hasta 65 mil millones de pesos entrenados en 1,4 billones de palabras.


Aún más interesante, Meta también tiene modelos de código abierto de 7, 13 y 33 mil millones de pesos. Estos LLM más pequeños permitieron a muchos equipos de investigación crear sus propios modelos ajustados basados en LLaMA.


Por nombrar solo algunos: Alpaca de Stanford, Vicuna y Koala de Berkeley, GPT4All y muchos, muchos más.


Con el aprendizaje reforzado a través de la retroalimentación humana, estos esfuerzos de investigación afirman que pueden alcanzar un rendimiento del 90-95 % del ChatGPT 3.5 comercial (175 000 millones de pesos), con solo 7 000 millones o 13 000 millones de pesos.


Cuando tiene estos modelos LLM más pequeños e implementaciones C++ optimizadas como llama.cpp , de repente puede ejecutar estos modelos localmente en su computadora portátil. Ahora tiene un asistente inteligente ejecutándose localmente que no depende del servicio en la nube y no cuesta nada.


Los modelos LLaMA son solo para investigación, por lo que no puede usarlos comercialmente.


Realmente existen LLM de código abierto, a pesar de que su escala y rendimiento están generaciones atrás de las alternativas comerciales de vanguardia. Sin embargo, muchos más LLM de código abierto están apareciendo como hongos después de una lluvia de otoño.


Si te mantienes alerta en huggingface y GitHub, puedes encontrar muchos de ellos como:


  • OpenAI: GPT-2 y GPT-Neo




Piensa fuera del laberinto

El laberinto


Office 365 podría ser el laberinto de Microsoft. ¿Por qué diría eso?


Sobre todo, Office 365 es de vital importancia para Microsoft desde el punto de vista de los ingresos y las ganancias (23 % de los ingresos totales en 2022 ( fuente ). Microsoft podría agregar capacidades de OpenAI a Office 365, pero podría seguir siendo una actualización incremental en lugar de un cambio fundamental.


Esto se debe simplemente a que Microsoft no puede mover a sus clientes empresariales, que se sabe que son reacios al riesgo y tienen un cambio glacial, a un nuevo paradigma a un ritmo demasiado rápido o de una manera demasiado dramática. Entonces, en cierto modo, Office 365 también es una especie de grilletes de Microsoft.


Entonces, ¿dónde están las oportunidades para las nuevas empresas jóvenes? Si retrocedemos un poco, la razón por la que creamos el paquete de Microsoft Office, que incluye Word, Powerpoint y Excel, fue que podíamos comunicarnos mejor en un entorno empresarial.


¿Cómo podemos inventar nuevas formas de comunicación que trasciendan más allá de estas herramientas existentes? Piense en cómo Slack y Notion han trascendido de los correos electrónicos y cómo Figma ha superado la suite creativa tradicional de Adobe.


Imagine cómo pueden funcionar las nuevas interfaces humano-máquina y humano-humano en un entorno empresarial.


Si desea ingresar a territorios de ciencia ficción, puede tener en cuenta Neuralink de Elon Musk, donde los humanos y las máquinas están conectados eléctricamente.


El advenimiento de tecnologías como Neuralink de Elon Musk, cuyo objetivo es establecer una comunicación directa entre el cerebro humano y las máquinas, abre interesantes posibilidades para reinventar la comunicación en el entorno empresarial.


Aquí hay algunas formas en que dicha tecnología podría trascender potencialmente las herramientas tradicionales como la suite de Microsoft Office:


  1. Comunicación de pensamiento a texto: con la ayuda de interfaces cerebro-computadora (BCI) como Neuralink, las personas pueden comunicar sus pensamientos directamente como texto o contenido visual, evitando la necesidad de teclados u otros dispositivos de entrada. Esto podría conducir a un intercambio de ideas más eficiente y rápido, minimizando los malentendidos y las faltas de comunicación que pueden surgir de los métodos convencionales.


  2. Lluvia de ideas colaborativa: las interfaces cerebro-computadora podrían permitir compartir pensamientos e ideas en tiempo real durante las sesiones de lluvia de ideas, lo que permitiría a los miembros del equipo contribuir y visualizar conceptos simultáneamente. Esto podría mejorar los procesos creativos de resolución de problemas y toma de decisiones, fomentando un entorno de trabajo más colaborativo y eficiente.


  3. Presentaciones inmersivas: la combinación de BCI con tecnologías de realidad aumentada (AR) o realidad virtual (VR) podría revolucionar las presentaciones comerciales. En lugar de depender de las herramientas tradicionales como PowerPoint, los presentadores pueden crear experiencias inmersivas e interactivas que involucren los sentidos y las emociones de la audiencia, lo que lleva a una comunicación más efectiva de conceptos e ideas complejos.


  4. Comunicación consciente de las emociones: las BCI podrían detectar emociones y estados mentales durante las conversaciones, lo que permitiría a los participantes comprender mejor los sentimientos y las perspectivas de los demás. Esto podría mejorar la empatía, facilitar la retroalimentación constructiva y fomentar relaciones de trabajo más saludables.


  5. Transferencia directa de conocimiento: Neuralink y tecnologías similares podrían allanar el camino para la transferencia directa de conocimiento entre individuos o de máquinas a humanos. Esto podría revolucionar los procesos de aprendizaje y formación en el lugar de trabajo, haciéndolos más eficientes y personalizados.


Si bien el desarrollo e implementación de tecnologías como Neuralink aún tiene un largo camino por recorrer, su potencial para transformar la comunicación en el entorno empresarial es innegable.


Al permitir formas de comunicación más directas, eficientes y empáticas, las interfaces cerebro-computadora podrían revolucionar la forma en que colaboramos, tomamos decisiones y compartimos conocimientos en el lugar de trabajo.

Un futuro incierto

Mira hacia el futuro


Si bien estoy emocionado y eufórico por la nueva ganancia de productividad de la combinación de OpenAI y GitHub de Microsoft, también me preocupa que una empresa pueda tener tanto poder sobre la totalidad de la inteligencia colectiva de la raza humana.


Espero que el joven Teseo pueda tomar la espada de código abierto y luchar por un nuevo camino fuera del laberinto para que el intelecto de la humanidad pueda prosperar libremente.


Nota al pie : todas las ilustraciones son del autor y de MidJourney