库,加剧全球信息体系和政治秩序中的不平等和垄断现象。在这种背景下,生成式人工智能技术服务提供者可以通过操纵算法或裁剪数据库的方式,在模型中植入某些价值观。如果开发者持有历史错解、文化偏见或种族歧视的价值观,这些观念可能会最终呈现为不实或仇视性的文本信息,并通过模型与用户的互动产生潜在的不利意识形态影响。在当今高度互联的社会中,生成式人工智能大面积生成虚假信息已经不再是单纯的个人信息权益问题,而是关系到国家安全和稳定的核心议题。2016年微软的聊天机器人Tay被黑客攻击,并被恶意操作,在网上传播种族主义和仇恨言论便是先例。Meta开发的聊天机器人Meta AI也有类似的经历。
(四)个人信息泄露频发的风险
个人信息泄露频发风险是生成式人工智能将给个人信息保护带来的又一大痛点。当前,生成式人工智能应用中的个人信息安全面临来自人工智能系统内在隐患与外部风险的双重考验。ChatGPT开发者OpenAI的首席技术官米拉·穆拉蒂率先表示,必须谨慎使用ChatGPT,切勿在其上上传敏感信息或核心数据,以免信息泄露,导致损失。为此,许多互联网公司纷纷向员工发出相关警报。微软基于预防商业机密泄露的考虑,已宣布禁止公司员工向ChatGPT分享公司敏感数据。同样,亚马逊公司律师也警告员工“不要与ChatGPT分享任何亚马逊的机密信息,因为他们有可能将其用于训练未来的模型。”事实证明,这种担心并非多余。近日,就在GPT-4最新发布之际,ChatGPT出现严重技术漏洞,用户在社交媒体上表示看到其他人的历史搜索记录标题。OpenAI随即立刻关闭ChatGPT,当用户再次打开该系统时,历史聊天记录侧边栏已被替换为“历史记录暂不可用,我们正在努力尽快恢复这一功能”。该事件正是由内部开源数据库错误所致,随后OpenAI首席执行官Sam Altman在社交媒体发文,宣布修复程序已验证完成,并对此“感觉十分糟糕”。可见,与其他人工智能技术一样,生成式人工智能模型本身存在着漏洞和安全隐患。诸如模型设计不当、存储系统错误、算法漏洞等都可能导致用户个人信息泄露频发。此外,黑客入侵人工智能系统的技术已催生出一个庞大黑色产业链,犯罪分子通过植入病毒性插件侵入数据库,也将对用户个人信息安全造成严重威胁。
其次,从运行角度来看,生成式人工智能还存在着一种高频、渐进的个人信息间接泄漏风险。生成式人工智能需要从大量数据中学习和生成模型,并不断改进模型,以提高生成文本的准确性。这就意味着,上一版本中收集的个人数据可能被用于模型训练并在未来版本中进行输出,从而间接导致个人信息泄露。例如,在ChatGPT中输入的文本可能包含具有隐私敏感性的信息,如医疗记录、司法文书、个人通讯记录等,而模型可能会学习到这些信息并在模型输出的结果中泄露这些信息。这种个人信息泄露乃至频发的风险,与生成式人工智能内在运行机理紧密关联,为生成式人工智能所特有,并且一定程度广泛存在于海量用户“人机对话”的过程中。只不过囿于生成式人工智能的高度复杂性和黑盒特性,其内部机制和应用过程往往难以被完全理解和掌控,从而使这种间接泄露及频发境况很难被发现和察觉。
生成式人工智能语料库中的个人信息泄露及其频发境况无疑会给用户带来隐私威胁、精神焦虑,甚至是财产、声誉和信任上的损失。如被不法分子滥用,进行信息关联和深度信息挖掘,严重时还可能威胁到国家数据安全和总体国家安全。伴随人类社会迈入数字文明时代,数字、信息堪称数字文明时代的“新石油”,数字、信息安全问题更是不容置若罔闻。
这章