人物档案 / 领导者

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势在互联网基础设施生态系统内被作为基础设施机构进行追踪。

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势
分类人物

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势在互联网基础设施生态系统内被作为基础设施机构进行追踪。

地区亚太

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势的公开来源与网络运营、治理、依赖映射或市场结构相关。

信号重点市场

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势在互联网基础设施生态系统内被作为基础设施机构进行追踪。

内容类型档案

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势在互联网基础设施生态系统内被作为基础设施机构进行追踪。

主要领域市场

公开来源信号支持对基础设施可见性与依赖分析的中等影响监测。

主题市场

BTW Media 将专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势收录为档案,因为公开证据表明其与互联网基础设施、治理、运营依赖性及市场可见度存在关联。

影响中等

公开来源信号支持对基础设施可见性与依赖分析的中等影响监测。

置信度有限置信度 (76%)

多个公开来源

BTW Media 将专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势收录为档案,因为公开证据表明其与互联网基础设施、治理、运营依赖性及市场可见度存在关联。

  • TorchV AI CTO 肖育敏是技术开发专家,专注于 RAG、向量搜索和非结构化数据解析。
  • 肖育敏讨论了公司专注于提供 B2B 解决方案、利用非结构化数据,以及在不断发展的人工智能驱动技术格局中面临的独特挑战与机遇。

近日,我们有幸与 TorchV AI 的 CTO 肖育敏进行了交流。TorchV AI是 Platform-as-a-Service (PaaS)写作辅助领域的领先创新者。自 2023 年创立以来,该平台凭借支持营销内容创作和官方文件起草的先进功能而备受瞩目。

肖育敏简介

肖育敏担任 TorchV AI 的 CTO。他从事 Java 和 Python 等技术开发工作,在技术架构、微服务、开源框架方面拥有丰富的专业知识,尤其专注于 RAG(检索增强生成)、向量搜索和非结构化数据解析。目前,他负责 TorchV AI 的产品和研发活动,专注于大模型、RAG 和向量搜索。此外,肖育敏还是开源中国 GVP 项目 Knife4j 的作者。

另请阅读:专访 Pigsty 作者冯若航:简化 PostgreSQL 管理,推动中国开源社区发展

问:我了解到贵公司的产品主要面向 B2B 客户。与百度“文心一言”、阿里巴巴“通义千问”等面向文档检索的生成式 AI B2C 产品相比,你们为何决定专注于服务 B2B 客户?

“在企业环境中,非结构化数据具有巨大价值。这就像给汽车加油;数据能为公司注入能量,持续释放其价值。”

肖育敏,TorchV AI CTO

最初,我们的目标是开发一个 Software-as-a-Service (SaaS)解决方案,目前我们提供两个版本。其中一个是在线 SaaS 服务,自 RAG 和大模型兴起以来一直在运营。早在 2019 年,我们就开始开发智能客服产品,尽管当时的技术栈有些过时。随着大模型的出现,我们从根本上转变了技术栈。以前,我们运营一个知识库,需要大量人力资源来维护信息。例如,如果用户询问上海的天气,我们的做法是维护特定的回复,要么使用天气 API,要么利用其他基于文本的知识,这对知识库工作人员来说要求很高。

抓住大模型带来的机遇,基于我们之前的经验,我们决定以知识库为基石开展业务。此外,正如你提到的,百度、阿里巴巴等大公司也在这一领域布局。然而,小型公司有其独特的优势。首先,许多中小型企业(SME)可能尚未完全实现数字化转型。随着人工智能的出现,我们开发的知识库能够使企业在早期数字化的基础上进一步发展,使 AI 成为一个相关性极强的产品。另外,在实际工作场景中,大约 80%的时间都在处理非结构化数据。

此外,我们坚信,在企业环境中,非结构化数据蕴含着巨大的价值。我们如何充分释放这些数据的潜力?这就像给汽车加油;数据能为公司注入能量,持续释放其价值。在与众多客户交流时,他们通常有类似的担忧。这类数据,包括文档,通常存储在员工个人的电脑上。他们希望有一个集中的数据平台,就像数据中台一样。然而,当我们之前讨论数据中台和大数据时,重点主要放在大型公司建立大数据中心上,但这并未充分发挥数据中台的价值,因为重心主要是结构化数据。

大公司拥有面向消费者的产品,如微信和钉钉,这些产品深度融入办公环境,积累了大量的数据,能够进行数据分析和挖掘。然而,对于中小型企业来说,这类产品并不符合他们的需求。他们拥有各种文档,包括财务记录、员工信息、合同以及其他相关文件。因此,挑战在于如何在 AI 时代有效地利用这些数据。我们目前的重点是利用这些工具,通过公司内部的协作方式来优化整个工作流程。

文章图片

问:在设计公司产品时,你们是否会针对不同客户的具体问题,量身定制不同类别的定制化产品?

针对您关于我们是否为客户专门定制产品的问题,我们不会进行大规模的定制。相反,我们是在构建一个基础的知识库,它是我们数据生态系统的基石。一旦这个基石建立起来,我们会在其上开发各种应用,比如一个旨在满足企业需求的应用中心。例如,今天我们可能需要创建一个用于合同审查的应用,以提高公司法务部门的效率。我们已经有了合同相关的应用,明天可能用于写作,特别是针对年度报告撰写等场景。我们根据客户的具体情况来调整应用,确保它能真正帮助企业在内部创建有用的 AI 场景。我们力求一个个地巩固这些应用。在商业环境中,部署 AI 与生成一张有趣的图片、视频或音乐截然不同。专业场景对 AI 的要求要高得多。

另请阅读:专访 Datastrato 创始人兼 CEO 杜均平:推动数据与 AI 创新

问:您能否谈谈在开发产品和解决方案过程中遇到的技术挑战?

确实存在几个具有挑战性的问题。正如技术人员常说的,这个问题似乎深不见底。目前,在业内,处理文档,尤其是 PDF 文件,可能是最困难且问题最多的方面。眼下,即便是最先进的系统如 ChatGPT4,也无法保证从 PDF 文档中完整准确地提取信息。据我们观察,这是一个持续的迭代过程,因为 AI 领域的每个人都在日益关注并着手解决这一问题。技术的发展无疑呈上升趋势,包括许多开源项目和各类 AI 模型,都在这一领域不断进步。

问:对于非结构化数据,您还有什么进一步的见解想与我们分享吗?

“解析、分析和理解非结构化数据的能力不仅是一项技术挑战,更是寻求竞争优势的企业的一项战略要务。”

肖育敏,TorchV AI CTO

非结构化数据是一种巨大且未被充分利用的资源,对组织而言蕴含巨大潜力。鉴于非结构化数据的复杂性和体量,要利用其价值需要创新的方法和技术。大语言模型和 AI 的进步使我们能够以前所未有的方式从这些数据中挖掘见解。在我看来,未来在于我们将这些数据转化为可行情报的能力,我们正朝着这一目标积极努力。

个人见解

肖育敏是人工智能和软件开发领域一位富有远见且务实的领导者。他在 RAG、向量搜索和非结构化数据解析等领域的深厚技术专长,加上他在开发 Knife4j 等开源项目中的实践经验,使他成为该领域可信的权威。肖育敏致力于利用 AI 技术解决现实世界的问题,尤其是在 B2B 领域,这反映出他对市场的理解以及对中小型企业所面临挑战的认识。

肖育敏的产品开发方法系统而专注,旨在创建可扩展的解决方案,以满足企业的多样化需求。他强调构建坚实的基础知识库作为各种应用的基石,这展现了他的战略思维和长远眼光。通过优先开发能够根据客户特定需求进行定制的应用,肖育敏展现了对在快速发展的技术格局中保持灵活性和适应性重要性的敏锐意识。

此外,肖育敏对处理非结构化数据的挑战,尤其是从 PDF 等文档中提取有意义信息的复杂性的见解,彰显了他对持续改进和创新的承诺。他对非结构化数据的战略价值及其为企业带来的潜力的认识,凸显了他的前瞻性思维以及为增长和竞争优势开辟新途径的专注。

总体而言,肖育敏是一位深思熟虑、积极进取的人,他将技术实力与对业务格局的清晰理解相结合。他在 TorchV AI 的领导以开发实用的 AI 解决方案为重点,这些解决方案能够真正改变企业在数字时代的运营和繁荣方式。

专业领域

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势 的公开档案基于可见角色、运营背景和相关报道。

  • 角色证据: 专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势 通过公开角色、服务背景和可复核资料进入 BTW 的观察范围。 证据基础: 多个公开来源
  • 运营背景: 市场、亚太构成该人物档案的公开语境。 证据基础: 多个公开来源

时间线

  1. 专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势 公开档案更新

    公开报道将 专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势 记录为需要按角色、运营语境和证据继续观察的主体。

角色与范围

  • 档案: 专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势
  • 当前角色: 专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势在互联网基础设施生态系统内被作为基础设施机构进行追踪。
  • 分析分类: 人物

信号图

  • 公开来源信号支持对基础设施可见性与依赖分析的中等影响监测。
  • 决策周期: 下一季度
  • 运营相关性: 中等

会员简报

深度档案背景

使用对应会员级别登录后,可解锁完整简报和来源说明。

仅限战略圈

战略圈

所有读者均可浏览。加入并登录后可解锁档案简报。

加入战略圈

仅限领导联盟

领导联盟

面向符合条件的 IP 资产所有者和管理层;登录后可解锁联盟简报。

加入领导联盟

公开视角

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势 的公开解读限于可见角色、运营语境和有证据支撑的关系。

观察点

  • 新的公开角色、合作、产品、政策或市场披露。
  • 涉及具名组织或人物的已验证关系变化。

限制说明

  • 私人或未经验证的说法不进入公开视图。

常见问题

为什么收录 专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势?

专访 TorchV AI CTO 肖育敏:利用非结构化数据获取商业优势 有公开证据显示其与数字基础设施、治理或市场报道相关。

这个档案的公开部分是什么?

公开层覆盖可见角色、运营语境、关联主体和有证据支撑的观察点。

读者接下来应关注什么?

读者应关注有来源支持的角色变化、新合作、监管暴露、运营扩张或会改变公开评估的证据。

返回全部人物