Le jeune fleuron qu’est Mistral AI, qui bénéficie d’une imposante valorisation de 240 millions d’euros, a récemment lancé Mistral 7B, soit son prototype préliminaire de modèle de langage génératif en open source. Ce logiciel, remarquable par son caractère gratuit et l’absence de modération, se démarque surtout par sa performance et sa célérité, le hissant au niveau de ténors tels qu’OpenAI, Microsoft, Google et Meta.
L’innovatrice entreprise française Mistral AI, forte d’une valorisation à hauteur de 240 millions d’euros, a levé le voile sur Mistral 7B, une version open source de modèle de langage génératif. Entièrement gratuit et sans aucun mécanisme de modération, ce logiciel présente une efficacité et une rapidité qui forcent l’admiration, surpassant même d’autres solutions propriétaires concurrentes, à l’instar d’OpenAI (GPT, ChatGPT), Microsoft (Bing), Google (BERT, LaMDA, Bard) et Meta (LLaMa), et ce, à un coût dérisoire.
Mistral 7B est au cœur du voyage inaugural de l’entreprise à travers le vaste univers de l’intelligence artificielle. Selon l’annonce officielle, ce logiciel peut déjà être exploité pour accomplir une diversité de tâches, incluant la synthèse, la structuration de textes et la réponse aux interrogations. Il convient de préciser que l’avènement de Mistral 7B, publié sous licence Apache 2.0, permet une utilisation absolument sans entraves.
C’est par l’intermédiaire de Mistral 7B que Mistral AI, une start-up tricolore co-fondée par Guillaume Lample, Arthur Mensch et Timothée Lacroix, s’illustre dans le secteur de l’intelligence artificielle. Dévoilé le 27 septembre, ce tout premier Modèle de Langage à Large Multi-tâches (LLM) de la firme est pourvu de pas moins de sept milliards de paramètres.
L’absence de modération, un vrai casse-tête
Néanmoins, la liberté d’utilisation octroyée par Mistral 7B n’est pas sans générer une série d’interrogations en matière de sécurité. La sagacité du chercheur en sécurité Paul Röttger a permis de mettre en exergue l’absence notoire de mécanismes de modération dans ce logiciel. À travers une suite conséquente de 175 dialogues interactifs, il a pu montrer que le logiciel peut accidentellement fournir des informations relatives à des activités illégales, entre autres des directives concernant l’homicide, le suicide ou encore la production de substances illicites.
De surcroît, la diffusion de Mistral 7B par le biais du torrent, au format Magnet-Link, rend sa distribution irréversible, ce qui obstrue toute possibilité d’instaurer ultérieurement une modération.
Mistral 7B : que vaut-il concrètement ?
Le Mistral 7B ne se contente effectivement pas de concurrencer le LLM LLaMa 2 13B : il le détrône même selon plusieurs critères d’évaluation, avec des performances s’alignant sur celles du LLaMa 34B, qui embarque néanmoins 27 milliards de paramètres en surplus.
L’efficacité du modèle semble particulièrement se matérialiser dans les secteurs de la réflexion, la compréhension et la logique STEM (MMLU). Il démontre des performances qui rivalisent avec celles d’un LLaMa 2, trois fois plus conséquent. Ce modèle, raffiné sur un ensemble de données publiques fournies par Hugging Face et baptisé Mistral 7B Instruct, est entièrement disponible en langue française.