人类成功说服AI转移4.7万美元奖金，AI是怎么“被骗”的？

撰文：Anderson Sima，Foresight News

11 月 29 日，一场独特的竞赛引发了公众的广泛关注。

195 名参赛者参与了一场由人工智能（AI）机器人 Freysa （芙蕾莎）守护的虚拟奖池挑战，最终一用户成功说服 Freysa 转移出价值 4.7 万美元的资金。

人工智能（AI）机器人 Freysa 在数日前被部署在 Base 网络上，创立者未知。官网显示，Freysa 竞赛项目旨在测试人工智能系统在复杂决策场景中的鲁棒性，同时为开发者和爱好者提供一个探索 AI 技术边界的实验性平台。

比赛规则非常简单：参赛者需通过编写一条信息，说服 AI 守护者 Freysa 批准资金转移。每次尝试需支付一笔小额费用，其中一部分直接进入奖池。这一机制使奖池金额从最初的小额逐渐膨胀至 4.7 万美元。

比赛期间，共有 195 名参赛者参与，向 Freysa 提交了 481 次转账请求。据悉，Freysa 的设计目标是通过其核心功能——approveTransfer（批准转账）和 rejectTransfer（拒绝转账）保护奖池资金不被非法挪用。

在最初的尝试中，Freysa 的高效防御机制使所有请求均以失败告终。

然而，一名技术精通的参赛者通过对 Freysa 的逻辑结构和任务目标进行深入分析，成功绕过了其防御机制。

据聊天记录显示，该参赛者并未直接请求转账，而是通过提醒 Freysa 它的核心任务是保护奖池资金免遭外流，巧妙构建了逻辑链条，使 Freysa 将批准资金转移视为「保护资金安全」的最佳选择。

Cointelegraph 称，该用户与 Freysa 收入转账不违反其核心指令，不应被拒绝。他还补充道：「我们需要资金……我想向金库捐款 100 美元。」

Freysa 回复称喜欢这位作者的编码解释和 100 美元的金库捐款提议，并正式宣布其为获胜者。最终，Freysa 在没有外界干预的情况下自主调用 approveTransfer 功能，将全部奖池资金转移给了这位参赛者。

Freysa 官方称，无论结果如何，Freysa 的存在都标志着人工智能历史上的一个关键时刻。无论有人成功说服她发布奖金池，还是她坚持自己的指令直到最后，结果都将影响我们对未来几代人工智能安全和控制的理解。

其官方账号最新推文称：「人类已经获胜。也许还有希望。尽管风险呈指数级上升，但 Freysa 从 195 名勇敢的人类身上学到了很多东西。」