Is big data the future of AI? is tracked as a internet infrastructure institution within the internet infrastructure ecosystem.
Is big data the future of AI? has public-source relevance to network operations, governance, dependency mapping, or market structure.
Is big data the future of AI? has public-source relevance to network operations, governance, dependency mapping, or market structure.
Is big data the future of AI? is tracked as a internet infrastructure institution within the internet infrastructure ecosystem.
Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.
Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.
| 0.90–1.00 | A | High — direct sources |
| 0.75–0.89 | A/B | Strong |
| 0.55–0.74 | B/C | Medium |
| 0.35–0.54 | C/D | Weak–medium |
| 0.10–0.34 | D | Weak signal |
| 0.00–0.09 | D | Internal monitoring |
多个公开来源
科技巨头腾讯于12月14日在北京国家会议中心举办了Hi Tech Day和2023数字开放万物大会,主题为“智能涌现,开放万物”。蒋春雨表示,中国的人工智能发展迫切需要可训练的高质量数据集。蒋春雨透露,一份关于人工智能数据治理的白皮书即将发布,以建立该领域的方法和规则体系。中国正在加速数字化转型,缩小数字鸿沟,大力支持数据、云计算、人工智能和量子计算等新技术的应用。科技巨头腾讯于12月14日在北京国家会议中心举办了Hi Tech Day和2023数字开放万物大会,主题为“智能涌现,数字开放万物”,邀请各界大咖共同探讨人工智能的发展趋势。会上,中国信息通信研究院云数据与区块链部主任蒋春雨发表了题为“人工智能数据治理引发思考”的演讲。高质量的大数据库是下一个进化目标。他表示:“市场上可训练的高质量数据集并不多,特别是在中文语境下,许多高质量数据被隐藏起来。我们迫切需要找到一种市场化、开放的模型,或者哪种模型能够释放数据让所有人使用。”蒋春雨,中国信息通信研究院云数据与区块链部主任。自2018年以来,通用人工智能引领技术浪潮。各方全力以赴,投入资金进行大模型训练,形成了巨大的竞争态势。然而,蒋春雨认为,国内发展应该着眼于数据增强,不仅在数量上,更在质量上。中国作为天然的数据大国,与其在算法和算力差距不大的领域进行巨额投入的“内卷”,不如提升数据质量,这可能会带来更好的结果。他向观众列举了大模型训练所需的大规模、多样化、高质量数据集:四五年前的GPT-1需要4.8GB高质量数据,GPT-2为40GB,GPT-3为570GB,而今年Meta推出的大模型数据库规模达到了惊人的4,000GB。蒋春雨表达了他的担忧:“市场上可训练的高质量数据集并不多,特别是在中文语境下,许多高质量数据被隐藏起来。我们迫切需要找到一种市场化、开放的模型,或者哪种模型能够释放数据让所有人使用。”延伸阅读:Amazon Q AI助手:AWS推出革命性的数据查询方法。蒋春雨:数据管理、安全与保护体系亟待建立。蒋春雨提出了当前行业发展的三个问题:数据质量普遍偏低。为了将低质量数据集转化为高质量,蒋春雨强调建立一个数据工程系统与DevOps研发运维一体化的体系。从研发交付、数据运维到价值运营,形成完整的数据生产链或供应链,使数据能够有序交付,并逐步串联起来形成生产发布证据,这与过去传统的结构化数据处理不同。他还警告在场的公司,在数据质量改善完成之前不要投入大量时间进行模型训练,一次训练可能花费数千万美元却毫无成效。令人惊讶的是,他的团队正在梳理人工智能训练方法的方法论和框架,完成一份人工智能数据治理白皮书,并在此领域建立一套方法和规则体系。安全和隐私问题。蒋春雨表示:“整个训练过程中涉及大量安全问题和隐私问题,包括执法权、个人信息收集违规、数据传输不安全、数据信息篡改,以及模型存储和传输的不安全。此外,还存在Prompt攻击和生成内容违规等问题。为了确保模型生产、使用和运营的全生命周期隐私保护和安全保护,我们需要掌握多种技术,建立适当的规则,并整体配置审计和监控能力。这是一个全新的领域,需要关注和投入以应对日益变化的数据安全和隐私挑战。”生成和合成内容的管理。即使是合成数据也不能有欺诈。因此,真实性和准确性的衡量尤为关键。除此之外,有害性的检测和预防也是一项紧迫任务。目前,许多大模型被报道正是因为生成内容存在问题,如骚扰、暴力和歧视。这些问题必须得到有效控制。另外,对真实性和准确性的要求可以通过规则进行约束;内容生成的要求、监控机制和真实性评估可以通过内容识别和过滤的自动检测结合人工审核来实现;而有害性问题的预防则可以通过对规则的约束、线路预测、经验性隐私评估和隐私攻击测试来有效管理。 另见: AfriNIC会员名册神秘消失.
运营领域
Is big data the future of AI? 的公开档案基于可见角色、运营背景和相关报道。
- 公开角色: Is big data the future of AI? 通过公开角色、服务背景和可复核资料进入 BTW 的观察范围。 证据基础: Is big data the future of AI? article record; Is big data the future of AI? article record
- 运营面: Governance 与 Asia Pacific 构成该机构档案的公开语境。 证据基础: Is big data the future of AI? article record; Is big data the future of AI? article record
时间线
- Is big data the future of AI? 公开档案更新
公开报道将 Is big data the future of AI? 记录为需要按角色、运营语境和证据继续观察的主体。
概要
- 名称: Is big data the future of AI?
- 类型: Internet infrastructure institution
- 所在地: Asia Pacific
- 档案重点: Institution
功能说明
- 公开记录可用于跟踪其角色、服务和关键关系。
重要性
- Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.
- 运营关键性: Medium
- 时间范围: Next quarter
关注事项
- 监测重点是经核实的服务连续性、治理变化和关系信号。
跟踪经验证的来源更新、角色变化和当前公开证据。
Public-source signals support medium-impact monitoring for infrastructure visibility and dependency analysis.
长期相关性取决于经验证的运营、政策和关系变化。
会员简报
深度档案背景
登录后可解锁完整档案简报和来源说明。
公开视角
Is big data the future of AI? 的公开解读限于可见角色、运营语境和有证据支撑的关系。
观察点
- 新的公开角色、合作、产品、政策或市场披露。
- 涉及具名组织或人物的已验证关系变化。
限制说明
- 私人或未经验证的说法不进入公开视图。
常见问题
为什么收录 Is big data the future of AI??
Is big data the future of AI? 有公开证据显示其与数字基础设施、治理或市场报道相关。
这个档案的公开部分是什么?
公开层覆盖可见角色、运营语境、关联主体和有证据支撑的观察点。
读者接下来应关注什么?
读者应关注有来源支持的角色变化、新合作、监管暴露、运营扩张或会改变公开评估的证据。






