- Datastrato, dirigé par Du Junping, est basé aux États-Unis et se spécialise dans l'infrastructure de données pour l'IA.
- L'entreprise se concentre sur l'amélioration de la gestion des données pour soutenir les technologies d'IA avancées.
- Datastrato construit un centre de données conçu pour gérer à la fois les données structurées et non structurées pour les applications d'IA.
Du Junping, fondateur et PDG deDatastrato, directeur de LF AI & DATA et membre de l'ASF, évolue depuis plus de dix ans dans les domaines open source de l'IA et des données. Il a occupé les postes de directeur général de l'activité Open Source pour une entreprise du Fortune 500, responsable Data Business et architecte en chef, ainsi que d'expert en technologie big data et dans le domaine open source. Il a été président du TOC (Technical Oversight Committee) de l'OpenAtom Open Source Foundation, membre de l'Apache Open Source Foundation, et committer et PMC pour des projets tels qu'Apache Hadoop et Submarine. Il a également été mentor pour des projets comme Apache YuniKorn etTubeMQ. Il a occupé des postes tels que président de l'alliance Open Source de Tencent et directeur de la R&D de la plateforme Big Data chez Hortonworks, dirigeant l'équipe Hadoop YARN.
Le rôle de l'open source dans les technologies d'IA et de données
« Comment gérer les données non structurées pour une meilleure utilisation par les grands modèles est sans aucun doute un défi majeur aujourd'hui dans le domaine de l'IA. »
Du Junping, fondateur et PDG de Datastrato
Lors d'un récent entretien avec Du Junping, fondateur et PDG de Datastrato, il a souligné le rôle essentiel des technologies open source dans l'avancement des applications d'IA et de données. Du Junping a insisté: « Je fais définitivement confiance à la communauté open source pour la loi d'échelle des ressources d'ingénierie et des valeurs technologiques. » Cette confiance repose sur la conviction que les cadres open source peuvent considérablement accélérer l'innovation et la collaboration dans l'industrie technologique.
Du Junping a également expliqué comment les technologies open source sont cruciales pour gérer les données non structurées. « Comment gérer les données non structurées pour une meilleure utilisation par les grands modèles est sans aucun doute un défi majeur aujourd'hui dans le domaine de l'IA. » Cette perspective souligne la nécessité de développer des outils open source robustes pour gérer la complexité croissante des données dans les applications d'IA.
De plus, Du Junping a souligné l'impact transformateur de l'IA générative, notant: « Nous voyons davantage de magie entre les données et l'IA, elles se combinent plus étroitement. » Cette synergie entre les données et l'IA stimule les progrès des capacités des modèles, rendant les contributions open source encore plus précieuses.
Lire aussi:OpenAI soutient un projet de loi californien pour l'étiquetage du contenu IA
Tendances qui façonnent l'avenir des technologies d'IA et de données
« L'open source est le seul moyen pour les développeurs de se rassembler et d'innover. »
Du Junping, fondateur et PDG de Datastrato
Du Junping a décrit plusieurs tendances clés qui façonnent l'avenir des technologies d'IA et de données. Il a observé: « Ces dernières années, nous avons vu l'IA générative créer de nombreux miracles. » Cette observation reflète les progrès rapides de l'IA, en particulier dans les modèles génératifs, qui repoussent les limites de ce qui est possible avec les données.
Il a ensuite détaillé les défis auxquels la technologie des données est confrontée, déclarant: « Nous nous attendons à voir un grand changement pour s'adapter à ce type de défis. » À mesure que les technologies d'IA progressent, la capacité à gérer et à utiliser efficacement les données devient de plus en plus critique. L'émergence des modèles d'IA générative amplifie la nécessité de techniques de traitement des données plus sophistiquées.
De plus, Du Junping a discuté de la nécessité de l'innovation open source pour suivre le rythme des avancées de l'IA. « L'open source est le seul moyen pour les développeurs de se rassembler et d'innover », a-t-il déclaré. Cette approche favorise un environnement collaboratif où diverses idées et expertises contribuent au développement de technologies avancées.

Implication dans la LF AI & Data Foundation
« Notre objectif est de faciliter l'implication des gens dans les projets open source, quel que soit leur niveau d'expérience. »
Du Junping, fondateur et PDG de Datastrato
L'implication de Du Junping auprès de la LF AI & Data Foundation reflète son engagement à faire avancer les initiatives open source. Il a noté: « Je suis impliqué dans LF AI & DATA depuis très longtemps », soulignant son engagement de longue date envers la fondation. Son rôle de président du conseil d'administration a consisté à promouvoir des projets et à favoriser la collaboration au sein de la communauté open source.
Il a décrit ses efforts pour renforcer l'impact de la fondation, déclarant: « J'ai participé à de nombreuses discussions sur la manière d'incuber le projet, du bac à sable jusqu'à l'obtention du diplôme. » Ce processus garantit que les projets open source mûrissent et deviennent plus accessibles aux contributeurs externes, stimulant ainsi l'innovation dans les secteurs de l'IA et des données. Du Junping a également mentionné son expérience dans la promotion de projets open source, notant: « Nous avons fait don de certains projets à LF AI & DATA et nous les avons promus.
» Cette expérience souligne son dévouement à étendre la portée et l'influence des technologies open source.
Lire aussi:Le PDG de GitHub plaide pour la concurrence et l'open source dans l'IA
Défis des modèles économiques open source
« L'avenir de la technologie des données réside dans notre capacité à gérer efficacement les données non structurées. »
Du Junping, fondateur et PDG de Datastrato
Réfléchissant à son expérience en tant que directeur général de l'activité open source dans une entreprise du Fortune 500, Du Junping a partagé ses réflexions sur les défis de la valorisation des initiatives open source. Il a déclaré: « Le premier défi sera de savoir comment valoriser l'open source », soulignant la nécessité d'équilibrer les intérêts commerciaux avec les propositions de valeur uniques des projets open source.
Il a expliqué l'importance de construire un modèle économique durable, en disant: « Comment construire un modèle économique commercial open source est important. » Cela implique d'aligner la stratégie commerciale de l'entreprise avec l'écosystème open source plus large, en veillant à ce que la technologie puisse collaborer efficacement avec la communauté mondiale.
Du Junping a également souligné le rôle de l'open source dans la stimulation de l'innovation, remarquant: « L'open source est très critique pour favoriser l'adoption. » Ce sentiment reflète la reconnaissance croissante des contributions open source comme essentielles à l'avancement des technologies d'IA et de données.
Conseils aux aspirants entrepreneurs et développeurs
Du Junping a offert des conseils précieux aux aspirants entrepreneurs et développeurs, soulignant l'importance d'adopter la collaboration open source. Il a dit: « Nous nous dirigeons vers l'innovation ouverte », suggérant que l'avenir des technologies d'IA et de données sera façonné par des efforts collectifs et des connaissances partagées.
Il a également souligné la nécessité d'un apprentissage et d'une adaptation continus, déclarant: « Nous devrions aller dans cette direction, l'innovation ouverte. » Ces conseils soulignent la nécessité pour les entrepreneurs et les développeurs de rester engagés auprès de la communauté open source et de tirer parti de son intelligence collective.
De plus, Du Junping a mis en évidence l'importance de la création de normes et de la réduction des obstacles, en disant: « Nous nous attendons à plus d'innovation open source. » Cette approche facilitera le développement de solutions standardisées et améliorera l'efficacité globale des technologies d'IA.

Objectifs à long terme et vision pour Datastrato
« Nous essayons de faire en sorte que les données puissent être partagées ou échangées en toute sécurité au sein de l'organisation et à l'extérieur. »
Du Junping, fondateur et PDG de Datastrato
Du Junping a partagé sa vision de l'avenir de Datastrato, en se concentrant sur le concept évolutif du big data. Il a déclaré: « Nous essayons de faire en sorte que les données puissent être partagées ou échangées en toute sécurité au sein de l'organisation et à l'extérieur. » Cette vision implique la création d'un environnement de données plus intégré et accessible, essentiel pour faire progresser les technologies d'AGI. Il a également discuté de l'importance de la diversité des données et des données multimodales, notant: « Les grands modèles de langage ont besoin de données diverses et multimodales.
» Cet accent mis sur la variété des données met en évidence la nécessité de solutions de données complètes pour soutenir le développement de modèles d'IA sophistiqués.
Du Junping a conclu avec une perspective optimiste sur les développements futurs, déclarant: « Nous voulons construire quelque chose comme cela dans les 5 à 10 prochaines années. » Ses objectifs à long terme reflètent un engagement à faire progresser les technologies de données et d'IA grâce à des approches innovantes et collaboratives.

