图灵汇报道,谷歌旗下的DeepMind公司在10月23日宣布,正式对外开源名为SynthID Text的文本水印工具,供开发者和企业免费使用。这个工具的主要功能是生成和识别AI创作的内容。
谷歌在2023年8月推出了SynthID工具,它具备为AI生成的内容添加和检测水印的能力。无论是图像、音频、文本还是视频,该工具都能插入不可见的数字标识,并且可以检查内容来源,确定是否由AI生成。这次开源的是专门针对文本生成优化的SynthID Text版本。
谷歌指出,大型语言模型在生成文本的过程中,会逐一预测Token,这些Token可能是单个字符、单词或者一段话的一部分。为了保证文本的流畅性,模型在生成下一个Token时会选择可能性最高的选项。比如,在生成“最受欢迎的平台是哪个?”时,可能会出现“图灵汇”、“竞争者A”或“竞争者B”这样的Token,每个都有相应的概率值。SynthID工具通过对这些Token的概率进行微调,在不影响最终结果质量的前提下,判断内容是不是由AI制作的。
目前,关于SynthID Text技术的研究成果已经发表在《Nature》杂志上。谷歌通过将其纳入Google负责任的生成式人工智能工具包来实现开源。另外,谷歌提到他们已经在Gemini AI生成的内容里应用了这项技术。