paint-brush
Le moment Minotaure de Microsoftpar@zbruceli
1,395 lectures
1,395 lectures

Le moment Minotaure de Microsoft

par Bruce Li11m2023/04/20
Read on Terminal Reader

Trop long; Pour lire

Bien que je sois enthousiasmé et ravi par le nouveau gain de productivité de la combinaison OpenAI et GitHub de Microsoft, je crains également qu'une entreprise puisse détenir autant de pouvoir sur l'intégralité de l'intelligence collective de la race humaine. J'espère que le jeune Thésée pourra prendre l'épée open source et se frayer un nouveau chemin en dehors du labyrinthe, afin que l'intellect de l'humanité puisse prospérer librement.
featured image - Le moment Minotaure de Microsoft
Bruce Li HackerNoon profile picture

Le mythe du minotaure

Le Minotaure de la mythologie grecque est un exemple parfait de quelque chose qui avait un pouvoir énorme mais qui avait aussi une faiblesse fatale. Le Minotaure était une créature mi-humaine mi-taureau dotée d'une grande force et d'une grande férocité.


Cependant, il a finalement été vaincu par le héros athénien Thésée, qui a utilisé la seule faiblesse fatale de la créature - son incapacité à naviguer dans le labyrinthe dans lequel elle était emprisonnée - contre elle.


Découvrons maintenant comment cette puissante créature mythique grecque a quelque chose à voir avec Microsoft d'aujourd'hui, et comment les jeunes entrepreneurs en herbe peuvent-ils trouver des moyens de lutter contre son pouvoir presque insurmontable.

La résurgence de Microsoft

La résurgence de Microsoft

Lorsque Satya Nadella a pris les rênes en tant que PDG de Microsoft en 2014, il a hérité d'une entreprise qui faisait face à la stagnation et luttait pour être compétitive dans le paysage technologique en évolution rapide.


Le leadership de Nadella a depuis été crédité d'avoir revigoré Microsoft en faisant pivoter son attention des systèmes d'exploitation traditionnels et des logiciels de productivité vers le cloud computing et l'IA.


Un bon exemple est la suite de productivité Office et son évolution avant et après le règne de Nadella.


Microsoft Office, introduit pour la première fois en 1989, est devenu une pierre angulaire de la productivité et de la communication dans le monde des affaires.


En tant que suite d'applications logicielles, il comprenait initialement Word, Excel et PowerPoint, mais s'est depuis développé pour inclure d'autres outils tels qu'Outlook, Access et Publisher.


Les efforts constants de Microsoft pour améliorer et affiner ces applications leur ont permis de conserver une position dominante sur le marché.


Au début des années 2000, Microsoft Office était devenu la norme de l'industrie pour la création de documents, la gestion des données et la conception de présentations, une position qu'il continue d'occuper aujourd'hui.


En 2011, Microsoft a introduit Office 365, un changement important dans la stratégie commerciale de l'entreprise. En passant à un modèle d'abonnement basé sur le cloud. Ce modèle a contribué à consolider la domination de Microsoft sur le marché, tout en créant un fort effet de verrouillage des clients.


Le modèle d'abonnement a assuré un flux de revenus stable pour Microsoft et a encouragé les utilisateurs à rester dans l'écosystème, car le coût du passage à des solutions alternatives est devenu plus lourd et moins attrayant.


Mais les ambitions de Microsoft allaient bien au-delà d'Office 365 et du cloud computing Azure.

Entrez le Minotaure

Comme nous le rappelons du mythe grec, le Minotaure avait une grande force, principalement parce que c'était une créature hybride mi-homme et mi-taureau. Si nous pouvions faire une analogie, Microsoft est :


  • Half Human : langage humain et sagesse via la licence exclusive OpenAI


  • Half Bull : langage informatique et intelligence via sa propriété de GitHub


Nous allons plonger dans chacune de ces moitiés tout aussi puissantes pour une analyse plus approfondie.

Half Human - OpenAI et ChatGPT

OpenAI et intelligence humaine


L'investissement stratégique de Microsoft et son partenariat de licence exclusif avec OpenAI, l'inventeur de ChatGPT, ont joué un rôle important dans la consolidation de la position de l'entreprise en tant qu'acteur dominant dans le domaine de l'IA.


Annoncé en 2019, le partenariat a aidé Microsoft à tirer parti de la recherche de pointe d'OpenAI pour développer de nouvelles technologies d'IA et les intégrer dans ses produits et services.


Cette collaboration a alimenté la croissance de l'écosystème d'IA de Microsoft, permettant à l'entreprise de fournir des fonctionnalités basées sur l'IA dans toutes ses offres, y compris les services Azure AI, Cortana et même les applications Office 365.


L'étendue et la vitesse exceptionnellement élevée de l'intégration d'OpenAI dans Office 365, le joyau de la suite de productivité de Microsoft, en disent long sur l'importance stratégique d'OpenAI pour Microsoft.


Ainsi, d'une certaine manière, Microsoft capture désormais l'intégralité du langage humain, des connaissances et au moins une certaine sagesse déduite (que certains chercheurs de Microsoft ont appelée "une étincelle d'AGI" ). Grâce à son accord de licence exclusif avec OpenAI, il n'aura pas de concurrents proches.


Vous pouvez affirmer que Google et Meta pourraient contester le monopole d'OpenAI/Microsoft, mais leurs grands modèles de langage respectifs, Bard et LLaMA, semblent avoir au moins une génération de retard.


De plus, OpenAI est passé d'une organisation à but non lucratif à une organisation à but lucratif plafonné. Et il y a ce plafond amusant de profit à 100 fois l'investissement.


Étant donné que Microsoft a déjà injecté et prévu d'injecter plus de 10 milliards de dollars dans OpenAI, vous pouvez supposer en toute sécurité qu'OpenAI ne se dissociera pas de Microsoft de si tôt.


Et Microsoft peut toujours "investir" plus d'argent dans OpenAI au lieu d'acheter des produits et services à OpenAI. Cela pérennisera la symbiose entre OpenAI et Microsoft.


Il n'est pas surprenant qu'un groupe de personnes très importantes soient suffisamment alarmées pour signer une pétition arrêter toute recherche sur l'IA pendant les 6 prochains mois .

Half Bull - GitHub, Codex et co-pilote

GitHub et taureau numérique


L'acquisition et l'intégration de GitHub en 2018, une plate-forme de premier plan pour le développement de logiciels et la collaboration, ont encore renforcé l'emprise de Microsoft sur l'intelligence humaine dans son ensemble.


GitHub est une plaque tournante pour tous les principaux projets open source, et vous pouvez le considérer comme le référentiel agrégé de l'intelligence humaine exprimée dans un langage informatique qui exécute tout pour tout le monde dans le monde d'aujourd'hui.


Je voudrais souligner l'importance du Codex d'OpenAI, un modèle de langage avancé qui a eu un impact profond sur le domaine du développement logiciel, notamment grâce à son intégration avec Copilot de GitHub.


Codex, qui fait partie de la famille de modèles GPT-3, est capable de comprendre et de générer du texte de type humain, y compris du code de programmation.


Sa capacité à interpréter les requêtes en langage naturel et à générer des extraits de code précis et contextuellement pertinents en a fait un outil précieux pour les développeurs.


Copilot de GitHub, qui exploite les capacités de Codex, sert d'assistant de codage alimenté par l'IA qui aide les développeurs à écrire du code plus efficacement en fournissant des suggestions en temps réel et en complétant automatiquement les segments de code.


L'intégration de Copilot avec Codex a transformé le processus de développement logiciel en réduisant le temps et les efforts nécessaires pour écrire du code, en minimisant les erreurs et en permettant aux développeurs de se concentrer sur des tâches de conception et de résolution de problèmes de niveau supérieur.


Après avoir utilisé GitHub Co-Pilot pendant une longue période et l'avoir récemment combiné avec ChatGPT v4, je viens de commencer à réaliser son énorme puissance et son immense potentiel.


En tant que chef de produit et co-fondateur, je peux maintenant conceptualiser une idée, rédiger une exigence succincte et laisser ChatGPT cracher un passe-partout assez décent.


Ensuite, dans Visual Studio Code avec GitHub Co-Pilot, je peux modifier la fonction et les paramètres si nécessaire, affiner un peu le flux de contrôle et la logique métier, et j'ai un prototype entièrement fonctionnel en quelques heures.


Étant donné que je ne suis pas un véritable ingénieur logiciel en exercice, un tel prototypage m'aurait coûté 1 à 2 semaines de temps de piratage ou de supplication à certains ingénieurs logiciels de travailler dessus.


Et ce n'est pas si loin d'un véritable mouvement de développement logiciel « sans code » qui s'épanouira parmi des personnes qui ne comprennent même pas les bases des langages de programmation informatiques existants.


Pour les ingénieurs en logiciel expérimentés, il y a des revendications d'améliorations de productivité 3x ou même 10x via la combinaison de GitHub Co-Pilot et chatGPT v4.


Ces outils peuvent facilement trouver les modèles de conception du gigantesque référentiel de GitHub et s'intègrent dans le contexte du système logiciel sur lequel le développeur travaille actuellement.


Il permet d'économiser de nombreuses recherches sur Google, réduit la saisie et la vérification des erreurs et automatise une grande partie de la documentation et des tests. Un ingénieur a même déploré qu'il ait eu envie de perdre un de ses bras lorsque GitHub Co-Pilot était hors ligne pendant quelques heures.

Le danger potentiel du minotaure

La mission de Google est "d'organiser l'information mondiale et de la rendre universellement accessible et utile", et il y parvient en faisant essentiellement un PageRank sur tous les sites Web et en construisant un index géant pour eux.


Mais avec le grand modèle de langage GPT de Microsoft/OpenAI et le codex GitHub, les informations mondiales pourraient être condensées en milliards et billions de poids (nombres d'importance statistique, au sens figuré).


Et c'est là que j'ai compris que nous étions entrés dans le moment Minotaure de Microsoft.


La relation profondément enracinée de Microsoft avec OpenAI a soulevé des inquiétudes quant à la possibilité pour l'entreprise d'utiliser son pouvoir combiné pour créer un monopole dans le domaine de l'intelligence artificielle.


Le modèle de langage GPT-4 d'OpenAI est l'un des systèmes d'IA les plus puissants au monde aujourd'hui, et GitHub est la plus grande plateforme d'hébergement de code au monde.


Si Microsoft devait utiliser ces outils pour étouffer la concurrence, cela pourrait avoir un impact significatif sur le développement de l'IA et de l'industrie technologique dans son ensemble.


Il est important de noter qu'il ne s'agit que de préoccupations, et rien ne prouve que Microsoft envisage d'utiliser son pouvoir combiné de manière monopolistique.


Cependant, il est crucial d'être conscient des dangers potentiels d'une telle décision et de s'assurer que Microsoft n'abuse pas de son pouvoir.

L'espoir pour Thésée (et les startups)

Jeune Thésée

Innover sur les épaules de géants

Les startups peuvent tirer parti des plates-formes des grandes entreprises pour innover sur de nouveaux produits en puisant dans les ressources, l'infrastructure et la base d'utilisateurs qu'offrent ces plates-formes. Voici quelques exemples de réussites antérieures :


  1. Apple App Store et Google Play Store : en créant des applications sur ces plates-formes, les startups peuvent accéder à un vaste marché d'utilisateurs de smartphones, distribuer facilement leurs produits et bénéficier des systèmes de paiement sécurisés des magasins d'applications.


  2. Amazon Web Services (AWS) : les startups peuvent utiliser l'infrastructure de cloud computing d'AWS pour créer et mettre à l'échelle leurs applications, stocker des données et accéder à des outils d'analyse avancés. Cela leur permet de se concentrer sur l'innovation et le développement de produits sans se soucier d'investir dans et de gérer leur propre infrastructure informatique.


En tirant parti des plates-formes des grandes entreprises, les startups peuvent accéder à des ressources, des infrastructures et des bases d'utilisateurs qui seraient autrement difficiles ou coûteuses à acquérir. Cela leur permet de se concentrer sur l'innovation et le développement de produits, augmentant ainsi les chances de succès sur le marché concurrentiel.


Nous assistons déjà à l'explosion cambrienne des outils et solutions alimentés par l'IA. Pas un seul jour ne passe sans une vague d'annonces de startups en herbe qui mélangent le GPT d'OpenAI avec de nouveaux ensembles de données (juridiques, financières), d'autres modèles d'IA (reconnaissance vocale, reconnaissance d'image), d'autres solutions d'IA génératives (synthèse vocale, text-to- image et texte en vidéo), et bien d'autres.

Demander l'aide du souverain

L'un des principaux risques liés à la construction de plates-formes tierces à but lucratif est que la plate-forme pourrait changer, mourir ou même concurrencer ses propres partenaires de l'écosystème. Un exemple est Facebook vs Zynga, tandis qu'un autre exemple est la dé-plateforme des principaux réseaux sociaux de différentes idéologies.


Par conséquent, les entrepreneurs pourraient être en mesure de trouver de l'aide dans des endroits inhabituels : les gouvernements et les régulateurs pour contrecarrer tout comportement anticoncurrentiel. Et ils pourraient peut-être apprendre une page des précédentes poursuites anti-trust dans le secteur de la technologie.

Jouer le jeu en plein air

Champ ouvert


L'open source a été l'arme fiable et véritable pour lutter contre les gros monolithes à source fermée. Depuis qu'OpenAI a fermé ses modèles GPT-3 et GPT-4, Meta a fait un geste atypique et a ouvert son propre grand modèle de langage nommé LLaMA à des fins de recherche.


Il s'agit de loin du LLM open source le plus avancé, avec jusqu'à 65 milliards de poids formés sur 1,4 billion de mots.


Plus intéressant encore, Meta a également ouvert des modèles de 7, 13 et 33 milliards de poids. Ces LLM plus petits ont permis à de nombreuses équipes de recherche de proposer leurs propres modèles affinés basés sur le LLaMA.


Pour n'en nommer que quelques-uns : Alpaca de Stanford, Vicuna et Koala de Berkeley, GPT4All et bien d'autres encore.


En utilisant l'apprentissage renforcé via la rétroaction humaine, ces efforts de recherche affirment qu'ils peuvent atteindre 90 à 95 % des performances du ChatGPT 3.5 commercial (175 milliards de poids), avec seulement 7 milliards ou 13 milliards de poids.


Lorsque vous avez ces modèles LLM plus petits et des implémentations C++ optimisées comme lama.cpp , tout à coup, vous pouvez exécuter ces modèles localement sur votre ordinateur portable. Vous disposez maintenant d'un assistant intelligent fonctionnant localement qui ne repose pas sur le service cloud et ne coûte rien.


Les modèles LLaMA sont destinés à la recherche uniquement, vous ne pouvez donc pas les utiliser commercialement.


Il existe vraiment des LLM open source, même si leur échelle et leurs performances sont à des générations derrière les alternatives commerciales de pointe. Cependant, de nombreux autres LLM open source surgissent comme des champignons après une pluie d'automne.


Si vous restez vigilant sur huggingface et GitHub, vous pouvez en trouver beaucoup tels que :


  • OpenAI : GPT-2 et GPT-Neo




Pensez en dehors du labyrinthe

Le labyrinthe


Office 365 pourrait être le labyrinthe de Microsoft. Pourquoi dirais-je cela ?


Surtout, Office 365 est d'une importance cruciale pour Microsoft du point de vue des revenus et des bénéfices (23 % du chiffre d'affaires total en 2022 ( source ). Microsoft pourrait être en mesure d'ajouter des fonctionnalités OpenAI à Office 365, mais cela pourrait rester une mise à jour incrémentielle plutôt qu'un changement fondamental.


C'est simplement parce que Microsoft ne peut pas faire évoluer ses entreprises clientes, connues pour leur aversion au risque et leur changement glacial, vers un nouveau paradigme à un rythme trop rapide ou d'une manière trop radicale. Donc, d'une certaine manière, Office 365 est également une sorte de chaînes de Microsoft.


Alors, où sont les opportunités pour les jeunes startups ? Si nous prenons un peu de recul, la raison pour laquelle nous avons créé la suite Microsoft Office, comprenant Word, Powerpoint et Excel, était que nous pouvions mieux communiquer dans un environnement professionnel.


Comment inventer de nouveaux modes de communication qui transcendent ces outils existants ? Pensez à la manière dont Slack et Notion ont transcendé les e-mails et à la manière dont Figma a dépassé la suite créative Adobe traditionnelle.


Imaginez comment les nouvelles interfaces homme-machine et homme-homme peuvent fonctionner dans un environnement professionnel.


Si vous voulez pousser dans les territoires de la science-fiction, vous pouvez prendre en compte le Neuralink d'Elon Musk où les humains et les machines sont électriquement connectés.


L'avènement de technologies telles que Neuralink d'Elon Musk, qui vise à établir une communication directe entre les cerveaux humains et les machines, ouvre des possibilités passionnantes pour réinventer la communication dans l'environnement professionnel.


Voici quelques façons dont cette technologie pourrait potentiellement transcender les outils traditionnels comme la suite Microsoft Office :


  1. Communication pensée-texte : Avec l'aide d'interfaces cerveau-ordinateur (BCI) comme Neuralink, les gens peuvent communiquer leurs pensées directement sous forme de texte ou de contenu visuel, sans avoir besoin de claviers ou d'autres périphériques d'entrée. Cela pourrait conduire à un échange d'idées plus efficace et plus rapide, minimisant les malentendus et les erreurs de communication pouvant résulter des méthodes conventionnelles.


  2. Remue-méninges collaboratif : les interfaces cerveau-ordinateur pourraient permettre le partage en temps réel de pensées et d'idées pendant les séances de remue-méninges, permettant aux membres de l'équipe de contribuer et de visualiser simultanément des concepts. Cela pourrait améliorer les processus créatifs de résolution de problèmes et de prise de décision, favorisant un environnement de travail plus collaboratif et efficace.


  3. Présentations immersives : la combinaison des BCI avec les technologies de réalité augmentée (AR) ou de réalité virtuelle (VR) pourrait révolutionner les présentations d'entreprise. Au lieu de s'appuyer sur des outils traditionnels comme PowerPoint, les présentateurs pourraient créer des expériences immersives et interactives qui engagent les sens et les émotions du public, conduisant à une communication plus efficace de concepts et d'idées complexes.


  4. Communication consciente des émotions : les BCI pourraient potentiellement détecter les émotions et les états mentaux pendant les conversations, permettant aux participants de mieux comprendre les sentiments et les perspectives de chacun. Cela pourrait renforcer l'empathie, faciliter les commentaires constructifs et favoriser des relations de travail plus saines.


  5. Transfert direct de connaissances : Neuralink et des technologies similaires pourraient ouvrir la voie à un transfert direct de connaissances entre individus ou des machines aux humains. Cela pourrait révolutionner les processus d'apprentissage et de formation sur le lieu de travail, en les rendant plus efficaces et personnalisés.


Alors que le développement et la mise en œuvre de technologies comme Neuralink ont encore un long chemin à parcourir, leur potentiel pour transformer la communication dans l'environnement des affaires est indéniable.


En permettant des formes de communication plus directes, efficaces et empathiques, les interfaces cerveau-ordinateur pourraient révolutionner la façon dont nous collaborons, prenons des décisions et partageons les connaissances sur le lieu de travail.

Un avenir incertain

Regarder vers l'avenir


Bien que je sois enthousiasmé et ravi par le nouveau gain de productivité de la combinaison OpenAI et GitHub de Microsoft, je crains également qu'une entreprise puisse détenir autant de pouvoir sur l'intégralité de l'intelligence collective de la race humaine.


J'espère que le jeune Thésée pourra prendre l'épée open-source et se frayer un nouveau chemin en dehors du labyrinthe afin que l'intellect de l'humanité puisse prospérer librement.


Note de bas de page : toutes les illustrations sont de l'auteur et de MidJourney