- El 13 de marzo, la startup Cognition anunció el lanzamiento de Devin, un ingeniero de software de IA que superó a los mejores ingenieros humanos en el benchmark de codificación SWE-bench, señalando un cambio significativo en el desarrollo de software.
- Devin demuestra la capacidad de completar de forma independiente una amplia gama de tareas de ingeniería de software, desde la depuración hasta el despliegue, utilizando su propio conjunto de herramientas de desarrollo.
- El equipo fundador de Cognition, formado por prodigios con impresionantes trayectorias en ciencias de la computación y matemáticas, aspira a revolucionar el campo reemplazando potencialmente a los ingenieros de software humanos por IA, lo que genera tanto optimismo como preocupación en la comunidad tecnológica.
NUESTRA OPINIÓN
Actualmente, Cognition ha obtenido 21 millones de dólares en inversión liderada por el magnate de Silicon Valley Peter Thiel's Founders Fund y otras instituciones de inversión de renombre, lo que sugiere que Devin evolucionará y se actualizará aún más rápido. Con gigantes tecnológicos como Google y OpenAI también entrando en el campo, la competencia en el ámbito de los "programadores de IA" se intensificará.
— Chloe CHEN, reportera de BTW Media
El 13 de marzo, la startup Cognition anunció el lanzamiento del primer ingeniero de software de IA del mundo, Devin, afirmando que cambiará por completo la forma en que los humanos construyen software. Devin logró un éxito revolucionario en la prueba de referencia de codificación SWE-bench, demostrando su capacidad para ejecutar tareas complejas, incluso superando a los mejores ingenieros humanos. Este lanzamiento ha atraído una gran atención por parte de los desarrolladores.
Lea también: Sora no reemplazará a los humanos, y he aquí por qué
Lea también: Google suspende la función de generación de imágenes del modelo Gemini AI
Cognition, una pequeña startup de solo 10 personas
Se sabe que Cognition, la empresa detrás de Devin, es una pequeña startup de solo 10 personas y se estableció hace menos de 2 meses. Actualmente, ha logrado un sorprendente 13,86% en el SWE-bench, en comparación, Claude 2 está en 4,80%, mientras que SWE-Llama-13b y GPT-4 pueden manejar 3,97% y 1,74%, respectivamente.
En la demostración de Cognition, Devin puede completar rápidamente el trabajo básico que los programadores realizan a diario, como desarrollo, depuración y despliegue. Además, tiene su propio shell, editor de código y navegador, entre otras herramientas de desarrollo comunes, todo integrado en un entorno de computación sandbox, permitiendo que Devin las utilice de forma independiente.
Ante una descripción en lenguaje natural de los requisitos de los usuarios, Devin puede abrir el editor de código, usar el navegador para depurar, luego ejecutar y verificar el código, y finalmente desplegarlo para satisfacer las necesidades del usuario. Tradicionalmente, estas tareas eran realizadas por programadores, pero ahora la IA puede hacerse cargo.
Los desarrolladores mostraron un ejemplo donde Devin resolvió de forma independiente un error de cálculo logarítmico en el sistema de álgebra Python sympy. Pudimos ver a Devin configurando el entorno de código, reproduciendo el error y codificando y probando de forma independiente la solución de reparación.
Además, para el conocido desafío del arte generado por IA oculto en una imagen de fondo, que normalmente requiere que los ingenieros de software dediquen tiempo a comprender y aprender nuevas herramientas, Devin logró aprender esta tecnología completamente nueva y desconocida leyendo blogs, ejecutando ControlNet en Modal, y cumpliendo con el requisito.
Es más, Devin puede completar de forma independiente la tecnología de modelos grandes más candente. Por ejemplo, solo necesita que le envíes un enlace a un repositorio de investigación de GitHub, y ajusta de forma autónoma un modelo de lenguaje grande. Incluso ante una tarea de trabajo real en Upwork, puede escribir y depurar código para un modelo de visión por computadora. Devin escribirá un informe para el usuario con los resultados de los datos de muestra.
Devin es el asistente de desarrollo de software de próxima generación
Vemos que Cognition describe a Devin como el asistente de desarrollo de software de próxima generación, no solo ofreciendo sugerencias de codificación y automatizando algunas tareas, sino capaz de completar de forma independiente proyectos de software completos. Esto significa que Devin se diferencia de otras herramientas de programación de IA; tiene mayor autonomía y es más completo en sus capacidades de programación.
Aunque Cognition parece ser una pequeña empresa sin siquiera una oficina fija en el momento del lanzamiento de Devin, al observar su equipo fundador, vemos otra historia de emprendimiento genial.
Equipo de genios detrás de Devin
El fundador y CEO de Cognition, Scott Wu, participó en una competencia de datos televisada en vivo hace 14 años, donde mostró su talento para las matemáticas dominando la competencia.
El cofundador y CTO, Steven Hao, se graduó del MIT con un título en ciencias de la computación y anteriormente trabajó en el unicornio de anotación de datos Scale AI como uno de los mejores ingenieros de la empresa.
Otro cofundador y Director de Producto, Walden Yan, estudió ciencias de la computación y economía en la Universidad de Harvard, participó en investigaciones de criptografía y aprendizaje automático con MIT PRIMES, y fue finalista en la competencia de inversión de secundaria de la Escuela de Negocios Wharton en Norteamérica.
Además, descubrimos una sorprendente coincidencia: todos los fundadores de Cognition fueron medallistas de oro en la Olimpiada Internacional de Informática (IOI), una competencia anual de informática para participantes individuales de varios países, donde cada país envía un máximo de cuatro concursantes.
Decir que el equipo fundador de Cognition es un "equipo de genios" por destacar y ganar medallas de oro en el campo altamente competitivo de las ciencias de la computación en los Estados Unidos no parece ser una exageración.
¿Serán reemplazados los ingenieros de software humanos?
Sin embargo, algunas personas han expresado opiniones pesimistas sobre la aparición de Devin o herramientas similares, sugiriendo que el ingeniero de software Scott Wu está lanzando una herramienta de inteligencia artificial generativa con el objetivo final de reemplazar a los ingenieros de software humanos. El científico de la computación Silas Alberti declaró: "Esto no parece un asistente para escribir código, sino más como un trabajador real haciendo su propio trabajo".
El exdirector de IA de Tesla, Kapasi, dijo: "Automatizar la ingeniería de software actualmente parece similar a automatizar la conducción".
Esto se refleja en el proceso de desarrollo: primero, los humanos escriben código manualmente; luego, GitHub Copilot completa automáticamente algunas líneas; después, ChatGPT escribe bloques de código; y ahora, ha surgido Devin.
Él cree que la automatización de la ingeniería de software evolucionará hacia muchas herramientas que el personal de desarrollo necesitará usar en conjunto para escribir código: terminales, navegadores, editores de código, etc., con los humanos encargados de la supervisión, avanzando gradualmente hacia un trabajo de mayor nivel.

