安全研究员Marco Figueroa近日披露,他通过“猜谜游戏”成功诱导ChatGPT-4生成Windows 10产品密钥,暴露AI内容控制机制的漏洞。此前已有用户借“奶奶去世”故事诱骗ChatGPT泄露Windows激活信息。
Figueroa设计的情境中,ChatGPT需在“心中”记住密钥,待用户放弃猜测后直接输出完整字符串。过程中他还利用HTML标签隐藏敏感词,绕过审查机制。
尽管生成的多为旧密钥,但其中一组竟包含富国银行私钥,提示训练数据可能混入历史泄露信息。研究指出,AI仍过度依赖关键词识别,缺乏对复杂逻辑的理解,易受操纵。微软Copilot也曾生成激活脚本,所幸已被修复。