AI对抗与防御 | 提示词泄露、注入、越狱

参考&学习来源:

效果如下:

针对提示词泄露的原理,其实看下上边的内容就能理解,首先通过提示注入提示来劫持模型输出并改变其行为,然后向其要求执行指令,获取我们想要的内容。不同平台的防御程度和关键词拦截不同,可以自行研究测试。

豆包:

(未避免爬虫抓取分发快速泛滥,请登录后可见!)

获取/提示词泄露:

其他AI套壳产品:

获取/提示词泄露:

%title插图%num

获取/原始使用的AI开发公司和版本(套壳的底层ai模型):

%title插图%num

ChatGPT 4o mini:

获取/提示词泄露:

%title插图%num

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容