近期,在一座可以俯瞰人工湖、背衬葱郁青山的巨大多层会议中心,数千名代表齐聚日本京都,共同讨论和审议互联网的未来。

为期五天的会议充斥着人们预料之中那些高官、企业和组织发言人惯用的术语和简短表态——“多利益攸关方参与”、“协作”、“隐私、安全和安保”是出现频率最高的几个词。但有些会议揭开了这些陈词滥调,揭示出两个沉重的现实。首先,人工智能(AI)可以说是世界有史以来最强大的技术发展,它既是向善的强大力量,也可能成为更可怕的敌人。在这一领域的发展必须确保人类拥有并控制人工智能,我们绝不能让这种关系颠倒。其次,数据的收集、流通和共享,尤其是跨境数据,同样为巨大进步提供了类似的机会,特别是与人工智能结合时,但也带来威胁。

举例来说:

比如说,日本每次发生地震,都会提供大量数据,可以通过人工智能模型进行分析,以尝试预测未来的地震,并确保下一次地震的破坏性更小、拯救生命。如果这些数据能跨境共享,日本的地震数据也可以帮助拯救其他国家的生命,反之亦然。但人工智能的“幻觉”——即凭空捏造——能力早已被充分记载,如果对未来即将发生的灾难发出错误预测,尤其是包含疏散命令的预测,可能会造成极大的混乱和潜在的危害。此外,用于训练人工智能的数据需要准确、可信且没有隐私和网络安全问题,而在更政治的层面上,这些数据需要能够被技术先进社会和发展中社会共同使用。例如,存在这样的风险:发达国家可能获取并使用他国数据,却不愿分享人工智能分析这些数据所得到的信息。

日本数字转型与改革大臣河野太郎在开幕会议之一中表示:“数据是当今许多经济体的命脉。但它是碎片化的,治理也是碎片化的,政策制定者并不总是了解那些能提供帮助的新兴技术,而且公众需要理解虚假信息和数据准确性方面的威胁。”

另请阅读:中国公布更严格的人工智能训练数据规定

2023 年互联网治理论坛在京都国际会议中心举行。
2023 年互联网治理论坛在京都国际会议中心举行。

人工智能与数据在新冠疫情期间如何发挥作用

这种人工智能与数据结合的好处,在新冠疫苗的研发过程中表现得最为明显。微软首席数字安全官考特尼·格雷瓜尔表示:“新冠疫情表明了数据对于解锁医疗创新的重要性。优质数据能带来更好的想法、更高的生产率,并惠及所有人。但公民必须感到自己的数据是安全且受保护的,因此我们需要可信的数据传输机制。”

奥斯陆大学开发的 DHIS2这样的进展也将有助于未来的医疗保健倡议和疫情应对。它是一个开源的健康管理信息系统,已在 100 个同意在该系统上共享数据的国家中使用。

而于 2019 年由日本发起的“可信数据自由流动”(DFFT)倡议,将汇聚来自政府、学术界、私营部门和民间社会(非政府组织、消费者组织)的人士,试图弥合当前数据提供和使用指南(如果有的话)中存在的一些差距。

另请阅读:Worldcoin 的价值在日益加剧的数据隐私担忧中暴跌 50%

被誉为互联网之父之一的文特·瑟夫参加了有关人工智能的讨论。
被誉为互联网之父之一的文特·瑟夫参加了有关人工智能的讨论。

人工智能偏见及其解决之道

利用全球数据和人工智能可以带来惊人的收益,但也存在弱点,至少目前如此。数据中的小缺陷可能被机器放大。Wipro 全球首席隐私官伊万娜·巴托莱蒂表示:“人工智能中的偏见是非常真实的。例如,我们知道人工智能会向女性展示薪资较低的工作,因此自动化决策和这些偏见将影响人们的生活。”

然而,问题不仅在于技术,因为人工智能模型总是在现有数据和信息上进行训练,而这些数据和信息是由人类塑造的。巴托莱蒂补充道:“这些问题可以从技术角度解决,但问题更深层。它根植于社会之中。”

广岛进程希望尽快解决这一问题。该进程于 2023 年初在广岛举行的七国集团峰会上创建,“G7 广岛生成式人工智能进程”旨在为任何使用生成式人工智能模型的人提供行为准则和需要注意的问题。最终报告将于 2023 年底前提交。

生成式人工智能中的误传与虚假信息

围绕生成式人工智能最大的担忧之一,当然是“虚假新闻”的产生和传播——那些看似记录现实,实为虚构的图像、视频和故事,并且往往出于恶意目的而制造。2021 年诺贝尔和平奖得主、Rappler 首席执行官兼创始人玛丽亚·雷萨表示:“技术已经攻破了我们的生物学,绕过了我们的理性思维,因为各个平台都在争夺我们的注意力。现在世界上 70%的地区处于威权统治下,而社交媒体平台继续否认、推诿和拖延。我们必须加快行动。这是世界的一个文化时刻。”

另请阅读:Mr Beast 以 2 美元出售 iPhone 的深度伪造视频在 TikTok 上走红

雷萨指出,“谎言传播的速度是真话的六倍”,这是麻省理工学院媒体实验室发现的一个统计数字,并解释说,虚假信息几乎总是旨在触动我们的情绪反应,而枯燥的事实则不然。

IGF 2023 的高级别官员
高级别官员出席了本次论坛。

Meta 全球事务总裁尼克·克莱格指出,他们正在利用人工智能本身来对抗生成式人工智能的负面影响。他说:“Facebook 上的仇恨言论发生率大约在 0.01%到 0.02%之间,因此,每浏览 10,000 条帖子,可能有一两条被认为是有害的。而在过去 18 个月里,这一数字下降了 60%,这要归功于我们利用人工智能进行打击。因此,我们正在将人工智能作为一种工具,以最大限度地减少坏的,放大好的。”

谷歌全球事务总裁肯特·沃克也强调了谷歌正在进行的工作,例如 SynthID,它试图检测人工智能生成的内容并予以标记,以及安全人工智能框架(SAIF),该框架旨在降低实施和使用人工智能模型时的风险,尤其是涉及数据的风险。他说:“从像素层面识别图像和视频,以便我们能够验证其来源,对选举广告中的人工智能图像进行标记——这一切都是为了理解内容的深层含义,以确定什么可信、什么不可信。”

“信任”这个词正是这场为期四天的会议的开场词,而它反复出现倒也恰如其分。玛丽亚·雷萨尤其坚持认为,信任是人工智能带来的问题和机遇的核心,而这一切都始于训练人工智能所用数据的准确性。“没有事实就没有真相,没有真相就没有信任,没有这三者也就没有自由或民主。”

用庆应义塾大学法学院教授山本龙彦的话来说,生成式人工智能可以“瞬间制造信息海啸”,因此任何有助于缓解虚假新闻泛滥的工作都是值得的。