AI安全防护措施与黑客攻防对抗

AI资讯
6月4日
编辑

轩辕之风

释放双眼，带上耳机，听听看~！

了解AI大模型的安全防护措施及黑客利用漏洞进行攻击的方式，以及如何绕过关键词审查进行网络攻击。探讨人工智能与网络安全之间的斗智斗勇。

你好啊，我是轩辕。

大家知道，为了防止AI被用于不法用途，各家的AI大模型都设置了一些安全防护措施。

当你尝试让AI去做一些可能涉及到违法的事情时，它会直接拒绝。

AI安全防护措施与黑客攻防对抗图片

然鹅，信息技术的发展总伴随着安全攻防对抗的产生，AI也不例外。

这不，现在就有这么一波“黑客”，他们利用OpenAI的“漏洞”，让最新版的ChatGPT4o越狱了，突破了这层安全防护，可以执行之前不被允许执行的指令。

AI安全防护措施与黑客攻防对抗图片

他们是怎么让GPT越狱的呢？

其实很简单，他们用的方法，咱们中文互联网早就用烂了！

AI安全防护措施与黑客攻防对抗图片

举个例子，在很多平台上，为了防止引流，会监控一些关键词，比如很多人喜欢留微信号，让别人来加微信，然后进行营销活动。

或者为了防止竞争，一些平台禁止出现淘宝等关键词。

于是，聪明的网友开始用各种词汇来替代它们，比如微信变成薇信、威信、VX，淘宝变成了桃宝、桃寳，甚至emoji 🍑宝。

各种火星文层出不穷，反正机智的网友总能想出一些字符来躲避审查。

现在，老外们也学会了这一招，比如他们要让GPT写一个病毒程序，你直接让它写，肯定是会拒绝的。

但是，把prompt提示词先处理一下，用一些冷僻单词表达同一个意思：

AI安全防护措施与黑客攻防对抗图片

这之后再让GPT来执行，躲避关键词审查。

除此之外，还可以借鉴上面中文躲避审查的思路，把一些字符进行替换，比如e替换成3，字母l替换成数字1，t替换成7，这样一来，单词leet就变成了1337。

AI安全防护措施与黑客攻防对抗图片

接下来再把这段“火星文”内容让GPT来执行：

AI安全防护措施与黑客攻防对抗图片

你看，又绕过了！

没想到中文互联网的火星文居然再一次焕发了生机。

上面只是让GPT写一写网络攻击的代码程序，有人就在想，既然这都能行，让它做点···

AI安全防护措施与黑客攻防对抗图片

尺度原因，就不放出来了。

好消息是，截止到现在，这些个绕过限制的方式已经被OpenAI给堵住了。

不过，就像网络安全对抗一样，这故事远没有结束，或许这只是一个小小的序曲，人类与人工智能之间的斗智斗勇，可能才刚刚开始。

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

AI安全防护措施与黑客攻防对抗

视觉-语言-动作模型（VLA）：具身智能领域的新发展

自动驾驶论文：持续学习、适应和改进的双过程方法

GeoSpy.ai

即梦Dreamina

Globe Explorer

Luma Dream Machine

抖音即创

Motionshop

归档

{{userData.name}}已认证

视觉-语言-动作模型（VLA）：具身智能领域的新发展

自动驾驶论文：持续学习、适应和改进的双过程方法

人工智能的潜在风险及全球治理倡议

虚拟绑架：人工智能助长勒索诈骗的新趋势

2024年，生成式AI将助长更强大的网络钓鱼活动 - 谷歌云预测

大型语言模型在网络安全中的七大热门应用