paint-brush
Código abierto: el siguiente paso en la revolución de la IApor@minio
109,797 lecturas
109,797 lecturas

Código abierto: el siguiente paso en la revolución de la IA

por MinIO6m2024/01/25
Read on Terminal Reader

Demasiado Largo; Para Leer

Esta exploración del futuro de la IA de código abierto analizará a los “pretendientes” y defenderá a los “reales” en el desarrollo de la IA para descubrir el motor de innovación que es el software de código abierto que funciona debajo de todo. La conclusión es que la IA de código abierto generará una pila de datos de código abierto.
featured image - Código abierto: el siguiente paso en la revolución de la IA
MinIO HackerNoon profile picture
0-item
1-item


Imagine un futuro en el que la IA no esté encerrada en bóvedas corporativas, sino construida al aire libre, ladrillo a ladrillo, por una comunidad global de innovadores. Donde la colaboración, no la competencia, impulsa los avances, y las consideraciones éticas tienen el mismo peso que el desempeño bruto. Esto no es ciencia ficción, es la revolución del código abierto que se gesta en el corazón del desarrollo de la IA. Pero las grandes tecnológicas tienen su propia agenda, enmascarando modelos restringidos como código abierto mientras intentan cosechar los beneficios de una comunidad verdaderamente abierta.


Revelemos las capas de código y revelemos la verdad detrás de estos esfuerzos. Esta exploración del futuro de la IA de código abierto analizará a los “pretendientes” y defenderá a los “reales” en el desarrollo de la IA para descubrir el motor de innovación que es el software de código abierto que funciona debajo de todo. La conclusión es que la IA de código abierto generará una pila de datos de código abierto.


La necesidad

Un artículo reciente de Matteo Wong en The Atlantic, ' Nunca existió la IA 'abierta' ' describe una tendencia creciente en el mundo académico y la comunidad de software hacia una IA verdaderamente de código abierto. "La idea es crear modelos relativamente transparentes que el público pueda utilizar, estudiar y reproducir de forma más fácil y económica, intentando democratizar una tecnología altamente concentrada que puede tener el potencial de transformar el trabajo, la policía, el ocio e incluso la religión". Ese mismo Atlantic sugiere que las grandes empresas tecnológicas como Meta están tratando de satisfacer esta necesidad en el mercado "dejando a la vista" sus productos. Están asumiendo las cualidades y la reputación positiva de la comunidad de código abierto sin realmente abrir el código fuente de su producto. Pero no hay sustituto para lo real. Esto se debe a que el verdadero software de código abierto impulsa la innovación y la colaboración: dos cualidades que se necesitan desesperadamente para avanzar con la IA de manera responsable.


Los pretendientes

LLaMA 2, es un modelo de lenguaje grande creado por Meta que es de uso gratuito tanto para uso comercial como de investigación. Lo que lleva a algunos a sugerir que LLaMA 2 es de código abierto. Sin embargo, Meta ha implementado algunas restricciones severas en el uso de su modelo. Por ejemplo, LLaMA 2 no se puede utilizar para mejorar ningún otro modelo de lenguaje grande. Una postura que va en contra de la tradicional modelo de innovación colectiva privada de software abierto que promueve la revelación libre y abierta de la innovación en beneficio de todos en la comunidad del software.


Meta paralizó aún más el uso de su modelo al no permitir la integración de LLaMA 2 con productos que tienen 700 millones de usuarios mensuales y al no revelar en qué datos se entrena su modelo o el código que utilizaron para construirlo. Al no revelarlo, Meta se abre a cuestiones de prejuicios inherentes y discriminación accidental. Un modelo entrenado con datos discriminatorios ofrecer respuestas discriminatorias . Sin que la comunidad de software en general pueda ver el código utilizado para construir el modelo para ver si se han incorporado salvaguardas o los datos utilizados para entrenarlo, nos quedamos a oscuras sobre estas cuestiones morales. en una época en la que investigación publicada sobre IA Está más preocupado por el desempeño que por la justicia y el respeto, esta ofuscación es particularmente inquietante.


Los verdaderos

Mistral AI ha ganado reconocimiento por sus modelos de lenguajes grandes de código abierto, en particular Mistral 7B y Mixtral 8x7B. La empresa se esfuerza por garantizar una amplia accesibilidad a sus modelos de IA, fomentando la revisión, modificación y reutilización por parte de la comunidad de software abierto.


vllm significa "servicio de modelos de lenguaje vectorizado de baja latencia" y es una biblioteca de código abierto diseñada específicamente para acelerar y optimizar modelos de lenguaje grandes (LLM). Es una herramienta poderosa que puede mejorar significativamente el rendimiento y la usabilidad de los LLM. Esto lo convierte en un activo valioso para los desarrolladores que trabajan en una variedad de aplicaciones de inteligencia artificial, desde chatbots y asistentes virtuales hasta creación de contenido y generación de código. Tanto es así que Mistral recomienda utilizar vLLM como servidor de inferencia para los modelos 7B y 8x7B.


EleutherAI es un laboratorio de investigación de IA sin fines de lucro que pasó de ser un servidor de Discord para discutir GPT-3 a una organización de investigación líder sin fines de lucro. El grupo es conocido por su trabajo en la capacitación y promoción de normas científicas abiertas en el procesamiento del lenguaje natural. Han lanzado varios modelos de lenguajes grandes de código abierto y participan en proyectos de investigación relacionados con la alineación y la interpretabilidad de la IA. Su Arnés LM El proyecto es probablemente la principal herramienta de evaluación de código abierto para modelos de lenguaje.


fi-2 es el LLM de Microsoft que supera su peso. Este modelo pequeño pero potente, formado con una combinación de textos sintéticos y sitios web filtrados, destaca en tareas como responder preguntas, resumir y traducir. Lo que realmente distingue a Phi-2 es su enfoque en el razonamiento y la comprensión del lenguaje, lo que conduce a un rendimiento impresionante incluso sin técnicas de alineación avanzadas.


Muchos modelos competentes de integración de código abierto están fortaleciendo el espacio general de IA generativa de código abierto. Estos son los últimos avances en código abierto e incluyen EAU-Grande-V1 y multilingüe-e5-largel .


Hay muchos más en este campo en constante crecimiento. Esta lista limitada es sólo el comienzo.


El código abierto impulsa la innovación

Al adoptar una filosofía de innovación abierta extrema, las empresas que realmente participan en el desarrollo de software de código abierto desafían las nociones tradicionales de ventaja competitiva al reconocer que No todo el buen código o las grandes ideas residen dentro de su organización. . Este cambio apoya la argumento que las innovaciones compartidas dentro del ecosistema de código abierto conducen a un crecimiento más rápido del mercado, proporcionando a las empresas de software incluso más pequeñas fondos de I+D más limitados oportunidad de beneficiarse de los derrames de I+D presentes en el software de código abierto. Esto se debe a que, a diferencia de la subcontratación tradicional, la innovación abierta mejora los recursos internos aprovechando la inteligencia colectiva de la comunidad, sin disminuir los esfuerzos internos de I+D. Lo que significa que las empresas de software de código abierto no tienen que sacrificar sus presupuestos para buscar liderazgo intelectual y código fuera de su organización.


Además, las empresas de software de código abierto impulsan estratégicamente la innovación mediante publicar código temprano y con frecuencia , reconociendo la naturaleza acumulativa del proceso de innovación en la comunidad de software. Todo lo cual quiere decir algo que muchos ya reconocen: el software de código abierto impulsa la innovación.


El código abierto fomenta la colaboración

A través de redes En la comunidad del software de código abierto, los emprendedores pueden cumplir objetivos tanto a corto como a largo plazo. Los objetivos de beneficios a corto plazo fortalecen a las empresas y los objetivos de beneficios a largo plazo las sostienen. Al mismo tiempo, este esfuerzo de creación de redes perpetúa la red misma, haciéndola crecer para el próximo emprendedor. Es bien sabido que las plataformas de código abierto brindan acceso al código fuente, lo que permite a los desarrolladores crear actualizaciones, complementos y otras piezas de software y utilizarlas según sus necesidades. Este tipo particular de colaboración experimentó un auge con la amplia adopción de Kubernetes por parte de la comunidad de software en general. Ahora más que nunca, las tecnologías modernas funcionan juntas con muy poca fricción y pueden estar juntas en cuestión de minutos en casi cualquier lugar.


Las grandes empresas tecnológicas reconocen esta profunda colaboración inherente a la comunidad de código abierto cuando lanzan libremente marcos, bibliotecas y lenguajes que crearon para mantener y desarrollar herramientas internas. Al hacerlo, se profundiza el grupo de desarrolladores capaces de trabajar en sus productos y se comienza a establecer el estándar sobre cómo deberían funcionar tecnologías similares. Ese mismo artículo de Atlantic cita al fundador de Meta, Mark Zuckerberg, diciendo que "ha sido muy valioso para nosotros ofrecer eso porque ahora todos los mejores desarrolladores de la industria están utilizando herramientas que nosotros también utilizamos internamente".


El código abierto engendra código abierto

Estos son factores por los que muy a menudo vemos sinergias entre empresas de código abierto. Las empresas de inteligencia artificial y aprendizaje automático de código abierto desarrollarán naturalmente soluciones con otros productos de código abierto, desde productos fundamentales como el almacenamiento de objetos hasta herramientas de visualización. Cuando una empresa de código abierto da un paso adelante, todos lo hacemos. Este enfoque coherente y combinado es probablemente nuestra mejor apuesta para desarrollar una IA que adopte un enfoque centrado en el ser humano. Estas fuerzas naturales inherentes a la necesidad del mercado de IA de código abierto, combinadas con las cualidades del software de código abierto de innovación y colaboración, impulsarán la pila de datos de IA de código abierto.


Únase y contribuya a esta conversación y a nuestra comunidad enviándonos un correo electrónico a [email protected] o enviándonos un mensaje en nuestro canal de Slack .


También publicado aquí .