最近,OpenAI 推出了一个新计划,把最新的图像生成技术集成到 ChatGPT 的 API 平台里。这样一来,开发者能更方便地把这项功能加到自己的应用程序或服务中。自从今年三月底推出以来,这项功能因为能生成逼真的吉卜力风格画作和虚拟人物而受到欢迎,吸引了许多新用户注册 ChatGPT,也给公司服务器带来了不小的负荷。
根据 OpenAI 的数据,在功能刚上线的一周内,就有超过 1.3 亿名 ChatGPT 用户生成了超过 7 亿张图片。这项技术的核心支持来源于名为“gpt-image-1”的多模态 AI 模型。这个模型不仅能生成各种风格的图像,还能同时生成多张图片,并且通过调整参数来平衡生成质量和速度。
为了保证内容符合规范,gpt-image-1 使用了和 ChatGPT 图像生成一样的安全机制,避免生成违规内容。开发者能够根据需要设定不同的审核敏感度,比如选择默认的“自动”模式,或者更宽松的“低”模式,后者对某些不适合特定年龄段的内容限制会少一些。
值得注意的是,所有由 gpt-image-1 创作的图像都会加上 C2PA 元数据水印,这样其他平台就能轻松判断这些作品是不是由人工智能生成的。在收费方面,OpenAI 设立了明确的标准,文本输入每百万 token 收费 5 美元,图像输入收费 10 美元,输出收费 40 美元。以此计算,制作一张正方形图像的成本大约分别是低质量 2 美分(约合 0.15 元人民币),中等质量 7 美分(约合 0.51 元人民币),高质量 19 美分(约合 1.4 元人民币)。
目前,包括 Adobe、Airtable、Wix、Instacart、GoDaddy、Canva 和 Figma 在内的多家知名企业已经开始使用或测试 gpt-image-1。例如,Figma 已经允许用户通过这项技术生成和修改图片;Instacart 正在研究如何利用它制作菜谱和购物清单的图片。