- Datastrato, liderada por Du Junping, tiene su sede en EE. UU. y se especializa en infraestructura de datos para IA.
- La empresa se centra en mejorar la gestión de datos para respaldar las tecnologías avanzadas de IA.
- Datastrato está construyendo un centro de datos diseñado para manejar tanto datos estructurados como no estructurados para aplicaciones de IA.
Du Junping, fundador y CEO deDatastrato, director de LF AI & DATA y miembro de ASF, ha estado profundamente involucrado en los campos de código abierto de IA y Datos durante más de una década. Se ha desempeñado como gerente general de Negocio de Código Abierto para una empresa Fortune 500, jefe de Negocio de Datos y arquitecto jefe, y como experto en tecnología de big data y el campo del código abierto. Ha sido presidente del TOC (Comité de Supervisión Técnica) en la OpenAtom Open Source Foundation, miembro de la Apache Open Source Foundation, y committer y PMC para proyectos como Apache Hadoop y Submarine. También ha sido mentor de proyectos como Apache YuniKorn yTubeMQ. Ha ocupado cargos como presidente de la alianza de código abierto de Tencent y director de I+D de la plataforma de Big Data en Hortonworks, liderando el equipo de Hadoop YARN.
El papel del código abierto en las tecnologías de IA y datos
“Cómo gestionar los datos no estructurados para un mejor uso en modelos más grandes es definitivamente un desafío principal hoy en día en el ámbito de la IA.”
Du Junping, fundador y CEO de Datastrato
En una reciente entrevista con Du Junping, fundador y CEO de Datastrato, destacó el papel fundamental de las tecnologías de código abierto en el avance de las aplicaciones de IA y datos. Du Junping enfatizó: “Confío plenamente en la comunidad de código abierto para la ley de escalado de recursos de ingeniería y valores tecnológicos”. Esta confianza se basa en la creencia de que los marcos de código abierto pueden acelerar significativamente la innovación y la colaboración en toda la industria tecnológica.
Du Junping también discutió cómo las tecnologías de código abierto son cruciales para gestionar datos no estructurados. “Cómo gestionar los datos no estructurados para un mejor uso en modelos más grandes es definitivamente un desafío principal hoy en día en el ámbito de la IA”. Esta perspectiva subraya la necesidad de desarrollar herramientas robustas de código abierto para manejar la creciente complejidad de los datos en aplicaciones de IA.
Además, Du Junping señaló el impacto transformador de la IA generativa, señalando: “Vemos más magia entre los datos y la IA, se combinan más estrechamente”. Esta sinergia entre datos e IA está impulsando avances en las capacidades de los modelos, haciendo que las contribuciones de código abierto sean aún más valiosas.
Lea también:OpenAI respalda proyecto de ley de California para etiquetas de contenido de IA
Tendencias que dan forma al futuro de las tecnologías de IA y datos
“El código abierto es la única manera de que los desarrolladores se reúnan e innoven.”
Du Junping, fundador y CEO de Datastrato
Du Junping describió varias tendencias clave que están dando forma al futuro de las tecnologías de IA y datos. Observó: “En los últimos años, vemos que la IA generativa crea muchos milagros”. Esta observación refleja el rápido progreso en IA, particularmente en modelos generativos, que están ampliando los límites de lo que es posible con los datos.
Además, profundizó en los desafíos que enfrenta la tecnología de datos, afirmando: “Esperamos ver un gran cambio para adaptarnos a este tipo de desafíos”. A medida que avanzan las tecnologías de IA, la capacidad de gestionar y utilizar datos de manera efectiva se vuelve cada vez más crítica. La aparición de modelos de IA generativa está amplificando la necesidad de técnicas de manejo de datos más sofisticadas.
Además, Du Junping discutió la necesidad de innovación de código abierto para mantenerse al día con los avances de la IA. “El código abierto es la única manera de que los desarrolladores se reúnan e innoven”, dijo. Este enfoque fomenta un entorno colaborativo donde diversas ideas y experiencia contribuyen al desarrollo de tecnologías avanzadas.

Participación en la Fundación LF AI & Data
“Nuestro objetivo es facilitar que las personas se involucren en proyectos de código abierto, independientemente de su nivel de experiencia.”
Du Junping, fundador y CEO de Datastrato
La participación de Du Junping en la Fundación LF AI & Data refleja su compromiso con el avance de las iniciativas de código abierto. Señaló: “He estado en LF AI & DATA durante mucho tiempo”, destacando su compromiso a largo plazo con la fundación. Su papel como presidente de la junta ha implicado la promoción de proyectos y el fomento de la colaboración dentro de la comunidad de código abierto.
Describió sus esfuerzos para mejorar el impacto de la fundación, afirmando: “Participé en muchas discusiones sobre cómo incubar el proyecto desde el sandbox hasta la graduación”. Este proceso garantiza que los proyectos de código abierto maduren y se vuelvan más accesibles para los contribuyentes externos, impulsando así la innovación en los sectores de IA y datos. Du Junping también mencionó su experiencia en la promoción de proyectos de código abierto, señalando: “Tenemos algún proyecto donado a LF AI & DATA y lo promovimos”. Esta experiencia subraya su dedicación a expandir el alcance y la influencia de las tecnologías de código abierto.
Lea también:CEO de GitHub aboga por la competencia y el código abierto en la IA
Desafíos en los modelos de negocio de código abierto
“El futuro de la tecnología de datos radica en la eficacia con la que podamos gestionar los datos no estructurados.”
Du Junping, fundador y CEO de Datastrato
Reflexionando sobre su experiencia como gerente general de negocio de código abierto en una empresa Fortune 500, Du Junping compartió ideas sobre los desafíos de valorar las iniciativas de código abierto. Afirmó: “El primer desafío será cómo valorar el código abierto”, enfatizando la necesidad de equilibrar los intereses comerciales con las propuestas de valor únicas de los proyectos de código abierto.
Explicó la importancia de construir un modelo de negocio sostenible, diciendo: “Cómo construir un modelo de negocio comercial de código abierto es importante”. Esto implica alinear la estrategia comercial de la empresa con el ecosistema de código abierto más amplio, asegurando que la tecnología pueda colaborar eficazmente con la comunidad global.
Du Junping también destacó el papel del código abierto en el fomento de la innovación, comentando: “El código abierto es muy crítico para impulsar la adopción”. Este sentimiento refleja el creciente reconocimiento de las contribuciones de código abierto como esenciales para avanzar en las tecnologías de IA y datos.
Consejos para emprendedores y desarrolladores aspirantes
Du Junping ofreció valiosos consejos a emprendedores y desarrolladores aspirantes, notando la importancia de adoptar la colaboración de código abierto. Dijo: “Nos estamos moviendo hacia la innovación abierta”, sugiriendo que el futuro de las tecnologías de IA y datos estará moldeado por esfuerzos colectivos y conocimiento compartido.
También señaló la necesidad de aprendizaje y adaptación continuos, afirmando: “Deberíamos ir por este camino, la innovación abierta”. Este consejo subraya la necesidad de que los emprendedores y desarrolladores se mantengan comprometidos con la comunidad de código abierto y aprovechen su inteligencia colectiva.
Además, Du Junping destacó la importancia de construir estándares y reducir barreras, diciendo: “Esperamos más innovación de código abierto”. Este enfoque facilitará el desarrollo de soluciones estandarizadas y mejorará la eficiencia general de las tecnologías de IA.

Metas y visión a largo plazo para Datastrato
“Intentamos hacer que los datos dentro de la organización también se puedan compartir o intercambiar de forma segura.”
Du Junping, fundador y CEO de Datastrato
Du Junping compartió su visión para el futuro de Datastrato, centrándose en el concepto evolutivo de big data. Afirmó: “Intentamos hacer que los datos dentro de la organización también se puedan compartir o intercambiar de forma segura”. Esta visión implica crear un entorno de datos más integrado y accesible, esencial para avanzar en las tecnologías AGI. También discutió la importancia de la diversidad de datos y los datos multimodales, señalando: “Los modelos de lenguaje grandes necesitan una gran cantidad de datos diversos y multimodales”.
Este énfasis en la variedad de datos destaca la necesidad de soluciones de datos integrales para apoyar el desarrollo de modelos de IA sofisticados.
Du Junping concluyó con una perspectiva optimista sobre los desarrollos futuros, afirmando: “Queremos construir algo así en los próximos 5 a 10 años”. Sus metas a largo plazo reflejan un compromiso con el avance de las tecnologías de datos e IA a través de enfoques innovadores y colaborativos.

