• Xiao Yumin, CTO de TorchV AI, es un experto en desarrollo técnico, con enfoque en RAG, búsqueda vectorial y análisis de datos no estructurados.
  • Xiao discute el enfoque de la compañía en proporcionar soluciones B2B, aprovechando los datos no estructurados, y los desafíos y oportunidades únicos en el panorama cambiante de las tecnologías impulsadas por IA.

Recientemente, tuvimos la oportunidad de sentarnos con Xiao Yumin, el CTO de TorchV AI.TorchV AIes un innovador líder en el espacio de asistencia de escritura como Plataforma como Servicio (PaaS). Ha estado causando sensación desde su creación en 2023 con su plataforma avanzada que apoya la creación de contenido de marketing y la redacción de documentos oficiales.

Introducción de Xiao Yumin

Xiao Yumin se desempeña como CTO en TorchV AI. Xiao ha estado involucrado en el desarrollo técnico utilizando Java y Python, con amplia experiencia en arquitecturas técnicas, microservicios, marcos de código abierto, y un enfoque particular en RAG (generación aumentada por recuperación), búsqueda vectorial y análisis de datos no estructurados. Actualmente, supervisa las actividades de producto e investigación en TorchV AI, concentrándose en grandes modelos, RAG y búsqueda vectorial. Además, Xiao es el autor del proyecto GVP de Open Source China, Knife4j.

Lea también:Entrevista con Feng Ruohang, autor de Pigsty: Simplificando la gestión de PostgreSQL y avanzando la comunidad china de código abierto

P: Entiendo que el producto de su empresa se dirige principalmente a clientes B2B. En comparación con productos B2C como ‘Wenyan Yixin’ de Baidu y ‘Tongyi Qianwen’ de Alibaba, que son IA generativa enfocada en la recuperación de documentos, ¿qué motivó su decisión de concentrarse en atender a la clientela B2B?

“Dentro de los entornos corporativos, los datos no estructurados tienen un valor significativo. Es como alimentar un vehículo; los datos pueden energizar a una empresa, liberando continuamente su valor.”

Xiao Yumin, CTO de TorchV AI

Inicialmente, nuestro objetivo era desarrollar una solución de Software como Servicio (SaaS), y actualmente ofrecemos dos versiones. Una es un servicio SaaS en línea, que ha estado en funcionamiento desde el advenimiento de RAG y los grandes modelos. Ya en 2019, estábamos involucrados en el desarrollo de productos de servicio al cliente inteligente, aunque con una pila tecnológica algo anticuada. Con la aparición de los grandes modelos, transformamos fundamentalmente nuestra pila tecnológica. Anteriormente, operábamos una base de conocimiento que requería recursos humanos sustanciales para mantener la información.

Por ejemplo, si un usuario preguntaba sobre el clima en Shanghái, nuestro enfoque implicaba mantener respuestas específicas, ya sea utilizando APIs meteorológicas o aprovechando otro conocimiento basado en texto, lo cual era bastante exigente para nuestro personal de la base de conocimiento.

Aprovechando la oportunidad presentada por los grandes modelos y basándonos en nuestra experiencia previa, decidimos lanzar nuestro negocio con la base de conocimiento como piedra angular. Además, como usted ha mencionado, grandes corporaciones como Baidu y Alibaba también están activas en este dominio. Sin embargo, las empresas más pequeñas tienen sus propias ventajas distintivas. En primer lugar, muchas pequeñas y medianas empresas (PYMES) pueden no haber adoptado plenamente la transformación digital.

Con el advenimiento de la inteligencia artificial, la base de conocimiento que hemos desarrollado nos permite construir sobre los esfuerzos de digitalización anteriores, haciendo de la IA un producto fuertemente relevante. Además, en nuestros escenarios de trabajo práctico, aproximadamente el 80% del tiempo se dedica a tratar con datos no estructurados.

Además, creemos firmemente que, dentro de los entornos corporativos, los datos no estructurados tienen un valor significativo. ¿Cómo desbloqueamos todo el potencial de estos datos? Es como alimentar un vehículo; los datos pueden energizar a una empresa, liberando continuamente su valor. Al interactuar con numerosos clientes, a menudo comparten preocupaciones similares. Gran parte de este tipo de datos, incluidos documentos, normalmente se almacena en las computadoras de los empleados individuales. Desean una plataforma centralizada para los datos, similar a un centro de datos.

Sin embargo, cuando antes hablábamos de centros de datos y big data, el enfoque se centraba en gran medida en las grandes empresas que establecían centros de big data, lo que no explotaba plenamente el valor de los centros de datos, ya que el énfasis estaba principalmente en los datos estructurados.

Las grandes corporaciones tienen productos orientados al consumidor, como WeChat y DingTalk, que están profundamente integrados en los entornos de oficina y tienen acumulaciones sustanciales de datos, lo que permite el análisis y la exploración de datos. Sin embargo, en las pequeñas y medianas empresas, estos tipos de productos no están adaptados a sus necesidades. Poseen una variedad de documentos, incluidos registros financieros, información de empleados, contratos y otros documentos pertinentes. Por lo tanto, el desafío radica en utilizar eficazmente estos datos en la era de la IA.

Nuestro enfoque actual radica en aprovechar eficazmente estas herramientas a través de métodos colaborativos dentro de la empresa para agilizar todo el flujo de trabajo.

Article image

P: Al diseñar los productos de su empresa, ¿adapta diferentes categorías de productos a medida para abordar los problemas específicos de diferentes clientes?

En respuesta a su consulta sobre si personalizamos productos específicamente para nuestros clientes, no realizamos una personalización extensa. En cambio, estamos construyendo sobre una base de conocimiento fundamental, que actúa como la piedra angular de nuestro ecosistema de datos. Una vez establecida esta piedra angular, desarrollamos una variedad de aplicaciones sobre ella, como un centro de aplicaciones diseñado para satisfacer las necesidades de las empresas. Por ejemplo, hoy podríamos necesitar crear una aplicación para revisión de contratos para mejorar la eficiencia del departamento legal de una empresa.

Tenemos una aplicación para contratos en funcionamiento, y mañana podría ser para redacción, enfocándonos específicamente en escenarios como la redacción de informes anuales. Adaptamos la aplicación a las circunstancias específicas de nuestros clientes para asegurar que realmente les ayude a crear escenarios útiles de IA dentro de su empresa. Nos esforzamos por consolidar cada aplicación una por una. En un contexto empresarial, implementar IA es marcadamente diferente a generar una imagen divertida, un video o una pieza musical. Las exigencias sobre la IA en un entorno profesional son considerablemente más altas.

Lea también:Entrevista con Du Junping, fundador y CEO de Datastrato: Impulsando la innovación en datos e IA

P: ¿Podría comentar algún desafío técnico al que se haya enfrentado durante el desarrollo de sus productos y soluciones?

Hay, de hecho, varios problemas desafiantes. Como suelen decir los tecnólogos, este problema en particular parece no tener fondo. Actualmente, en la industria, el manejo de documentos, particularmente PDFs, es quizás el aspecto más difícil y problemático. En la actualidad, ningún proveedor, ni siquiera los sistemas más avanzados como ChatGPT4, puede garantizar la extracción completa y precisa de información de documentos PDF. Tal como observamos, es un proceso iterativo en curso, dado que todos en el campo de la IA se centran cada vez más en abordar este problema.

El desarrollo de la tecnología ciertamente tiene una tendencia al alza, incluyendo muchos proyectos de código abierto y varios modelos de IA que están avanzando en esta área.

P: ¿Hay alguna otra idea que le gustaría compartir con nosotros sobre su perspectiva de los datos no estructurados?

“La capacidad de analizar, examinar y comprender los datos no estructurados no es solo un desafío tecnológico, sino también un imperativo estratégico para las empresas que buscan obtener una ventaja competitiva.”

Xiao Yumin, CTO de TorchV AI

Los datos no estructurados representan un recurso vasto y sin explotar, uno que tiene un inmenso potencial para las organizaciones. Dada la complejidad y el volumen de los datos no estructurados, aprovechar su valor requiere enfoques y tecnologías innovadoras. El advenimiento de los grandes modelos de lenguaje y los avances en IA nos han permitido desbloquear conocimientos de estos datos de maneras que antes eran inimaginables. Desde mi perspectiva, el futuro radica en nuestra capacidad para convertir estos datos en inteligencia procesable, y estamos trabajando activamente hacia ese objetivo.

Una visión personal

Xiao Yumin emerge como un líder visionario y pragmático en el ámbito de la inteligencia artificial y el desarrollo de software. Su profunda experiencia técnica en áreas como RAG, búsqueda vectorial y análisis de datos no estructurados, junto con su experiencia práctica en el desarrollo de proyectos de código abierto como Knife4j, lo posiciona como una autoridad creíble en su campo. El compromiso de Xiao de aprovechar las tecnologías de IA para resolver problemas del mundo real, particularmente en el sector B2B, refleja su comprensión del mercado y los desafíos que enfrentan las pequeñas y medianas empresas.

El enfoque de Xiao para el desarrollo de productos es metódico y centrado en crear soluciones escalables que puedan adaptarse para satisfacer las diversas necesidades de las empresas. Su énfasis en construir una base de conocimiento fundamental sólida como piedra angular para varias aplicaciones muestra su pensamiento estratégico y su visión a largo plazo. Al priorizar el desarrollo de aplicaciones que puedan adaptarse a los requisitos específicos del cliente, Xiao demuestra una aguda conciencia de la importancia de la flexibilidad y la adaptabilidad en un panorama tecnológico en rápida evolución.

Además, las ideas de Xiao sobre los desafíos del manejo de datos no estructurados, particularmente las complejidades asociadas con la extracción de información significativa de documentos como PDFs, revelan su compromiso con la mejora continua y la innovación. Su reconocimiento del valor estratégico de los datos no estructurados y el potencial que tienen para las empresas subraya su mentalidad visionaria y su dedicación a desbloquear nuevas vías de crecimiento y ventaja competitiva.

En general, Xiao Yumin es un individuo reflexivo e impulsado que combina destreza técnica con una clara comprensión del panorama empresarial. Su liderazgo en TorchV AI se caracteriza por un enfoque en el desarrollo de soluciones prácticas de IA que pueden transformar genuinamente cómo operan y prosperan las empresas en la era digital.