- La startup francesa Mistral sorprende a la industria con el lanzamiento de Mixtral 8x7B a través de un enlace Torrent.
- Los usuarios aplauden la destreza del LLM, superando a GPT-3.5 de OpenAI y otros.
- El compromiso de código abierto de Mistral en la guerra cultural de la IA la distingue.
En una sorprendente movida que ha llamado la atención en la comunidad tecnológica, la startup francesa de IA Mistral ha lanzado su último modelo de lenguaje extenso (LLM) al dominio digital sin previo aviso, publicándolo a través de un discreto enlace Torrent en el popular foro X. Este enfoque poco ortodoxo contrasta marcadamente con las prácticas tradicionales de presentar algoritmos de vanguardia mediante giras de prensa y publicaciones de blog cuidadosamente elaboradas.
El lanzamiento poco convencional de Mistral genera revuelo en línea
Mistral, que recientemente aseguró una impresionante ronda de financiación Serie A de 415 millones de dólares, ahora cuenta con una valoración estimada de 2 mil millones de dólares. La última creación de la startup, denominada Mixtral-8x7B, ha llamado rápidamente la atención por su impresionante rendimiento, con usuarios afirmando que supera fácilmente las capacidades de GPT-3.5 de OpenAI, uno de los LLM líderes en el campo.

La decisión de lanzar el modelo a través de un enlace Torrent ha sido recibida con una mezcla de diversión y admiración, particularmente en el foro X, donde los usuarios aprecian la actitud aparentemente despreocupada y hacker de Mistral. Un comentarista en el foro destacó la ausencia de los elementos promocionales habituales, afirmando: «Sin blog, sin bombo, sin descripción, solo un torrent con los archivos del modelo... Mistral entiende que su audiencia principal son los ingenieros y conoce sus zonas erógenas culturales».
Mistral rompe el silencio con detalles sobre Mixtral-8x7B
Si bien el lanzamiento inicial dejó a los usuarios especulando sobre los motivos de Mistral, la compañía finalmente dio seguimiento con una publicación de blog el lunes, proporcionando más detalles sobre Mixtral-8x7B. Según los benchmarks compartidos en la publicación, el algoritmo de Mistral supera a algunos de sus competidores estadounidenses, incluyendo la familia Llama 2 de Meta y el renombrado GPT-3.5 de OpenAI.
A medida que surgen más y más productos de IA en el mercado, los usuarios compararán estos productos. Mixtral-8x7B-32kseqlen, abreviado como Mixtral. Lulu Cheng Meservey piensa que suena como algo de Elon Musk porque es solo una descripción simple (mezcla de expertos, 8 modelos, 7 mil millones de parámetros, tamaño de contexto de 32k).
Sin blog, sin bombo, sin descripción, solo un torrent con los archivos del modelo. Un corte de carne sencillo.
En resumen: Mistral entiende que su audiencia principal son los ingenieros y conoce sus zonas erógenas culturales. En comparación con el lanzamiento de Google, la velocidad de Mistral, su enfoque en la sustancia, el minimalismo lacónico y el 'mic drop' sin fanfarria gana esta ronda.
Lulu Cheng Meservey, CCO/EVP de Activision Blizzard; cuenta personal. Ex-Substack y cofundadora de TrailRunner.
La comunidad en línea hace eco de los elogios al nuevo algoritmo de Mistral
La comunidad en línea ha hecho eco de estos sentimientos, elogiando la velocidad y eficiencia del nuevo algoritmo de Mistral. Los memes y cumplidos inundaron el foro X, enfatizando el aparente éxito de Mixtral-8x7B. Un aspecto interesante de la estrategia de lanzamiento de Mistral es que el modelo es de código abierto, un marcado contraste con el enfoque de código cerrado de OpenAI que ha enfrentado críticas en la industria.
El compromiso de Mistral de abrir el código de todo su software de IA se alinea con la visión más amplia de la compañía, según lo declarado por el CEO Arthur Mensch. Mensch destacó la dedicación de Mistral a «un enfoque abierto, responsable y descentralizado de la tecnología», posicionando a la empresa firmemente dentro de una creciente guerra cultural en la industria de la IA.
A medida que Mistral irrumpe en las normas tradicionales de lanzamientos de modelos de IA, el éxito de Mixtral-8x7B y su naturaleza de código abierto desafían a los actores establecidos en el campo. Queda por ver si el enfoque poco convencional de Mistral se convertirá en tendencia o seguirá siendo un incidente aislado, pero el rápido ascenso de la compañía y sus audaces estrategias indudablemente han dado de qué hablar en el mundo tecnológico.

