摘要:互联网写作的资深人士分享了自己在博客上发布的内容,从那时起,他们便意识到了个人数据在AI系统中的潜在价值与风险。ChatGPT等新一代人工智能聊天机器人所利用的大量学习资料,包括社交媒体帖子、书籍等公开信息,使得它们能够预测词汇序列并给出流畅的回应。然而,这种学习机制导致的问题在于,一旦AI掌握信息,便难以实现信息的删除或遗忘。
正文:
数十年的互联网写作历史,尤其是青少年时期的博客创作,揭示了个人数据在现代技术发展中的重要角色。在ChatGPT这类人工智能聊天机器人获取信息的背景下,这些早期作品成为了其知识库的一部分。尽管个人可能希望从这类系统的数据库中清除自己的记录,但缺乏有效的“删除”选项凸显了数据留存的复杂性。
人工智能聊天机器人的学习基础涵盖了广泛的在线资源,从社交媒体动态到近25万本出版物,以及所有公开信息。它们通过生成答案来预测语言序列的后续内容,展现出对广泛主题的解答能力。然而,这种学习方式也带来了隐私挑战。由于AI基于汇总数据生成响应,因此难以精确删除或遗忘特定信息,即便是个人也无法准确追踪AI对其知识的理解程度。
澳大利亚联邦科学与工业研究组织的研究员大卫张指出,此类语言模型依据综合数据生成答案,这使得它们难以实现特定信息的删除或遗忘,即使对于个人来说,准确追踪AI对其了解的边界也是个难题。这一情况在隐私保护方面提出了重大挑战,尤其是考虑到欧盟提出的“被遗忘权”。该权利允许人们要求从网络记录中删除个人信息,包括撤销内容、删除帖子或请求网络公司移除有关自己的数据。然而,这一解决方案与AI聊天机器人系统不兼容,因为它们无法提供从模型记忆中删除或遗忘数据的方法。
苏黎世联邦理工学院的计算机科学家特拉梅尔强调,面对越来越敏感的个人信息输入,如医疗数据和电子邮件,AI公司需要寻找解决之道。此外,AI系统还可能受到黑客攻击,获取用户账户密码等信息。对此,英国政府通信总部已经关注这一问题。
当前,AI公司依赖诸如“机器沉默”等策略来限制对特定信息的访问并拒绝回应。例如,在尝试构建个人档案时,AI可能会回应称无法执行该请求。耶鲁大学的数字伦理中心主任弗洛里迪认为,这种方法在某种程度上可行,但目标数据仍然存在,潜在风险在于,如果系统发生故障或遭遇恶意干扰,仍有可能在回复中泄露信息。
伦敦政治经济学院的人工智能研究者阿里博伊尔提出,人类的健忘倾向在认知层面有时是一种有益的机制,它帮助我们高效地筛选和存储信息。类比于人类大脑如何通过忘记不必要的记忆来优化信息检索过程,人工智能系统也可能从选择性遗忘中获益。2017年,谷歌人工智能实验室研发的人工智能展示了在多款电子游戏中运用遗忘机制的能力,优先存储令人惊讶的游戏玩法,忘记其他数据,结果发现系统的性能有所提升。对于追求模仿人类学习和思考模式的AI研究人员而言,设计系统能够有选择性地遗忘,可能是实现更高效、更智能系统的关键。
综上所述,随着AI技术的不断进步,如何在保障隐私的同时,探索AI系统的遗忘机制,成为了一个亟待解决的挑战。这不仅关系到个人数据的安全,还涉及到如何构建更加智能、灵活且可控的人工智能系统。