您的位置:首页>科技 >内容

OpenAI的假新闻警告如何触发实际的假新闻

2019-03-31 16:05:34来源:
导读哪个是更大的威胁:人工智能产生的假新闻还是人工智能的假新闻?至少目前,我们应该更加担心后者。非营利性人工智能研究实验室OpenAI上个月

哪个是更大的威胁:人工智能产生的假新闻还是人工智能的假新闻?至少目前,我们应该更加担心后者。

非营利性人工智能研究实验室OpenAI上个月引入了一波AI启示录恐慌,当时它引入了一种最先进的文本生成AI,称为GPT-2。但是当它庆祝GPT-2的成就时,OpenAI宣布它不会向公众发布其AI模型,担心在错误的手中,GPT-2可能被用于恶意目的,例如产生误导新闻文章,冒充他人在线,并在社交媒体上自动生成虚假内容。

意见可以预见的是,OpenAI的公告创造了大量耸人听闻的新闻报道,但是虽然任何先进技术都可以武器化,但AI在掌握文本生成之前还有很长的路要走。即便如此,创造假新闻危机还需要不止文字生成的AI。从这个角度来看,OpenAI的警告被夸大了。

人工智能和人类语言

计算机历史上一直在努力处理人类语言。书面文本中有如此多的复杂性和细微差别,将所有这些都转换为经典的软件规则几乎是不可能的。但是深度学习和神经网络的最新进展为创建可以处理语言相关任务的软件的不同方法铺平了道路。

深度学习为机器翻译,文本摘要,问答和自然语言生成等领域带来了巨大的改进。它允许软件工程师通过分析许多示例来创建开发自己行为的算法。对于与语言相关的任务,工程师为神经网络提供数字化内容,如新闻报道,维基百科页面和社交媒体帖子。神经网络仔细比较数据并记录某些单词在重复序列中如何跟随其他单词。然后,他们将这些模式转化为复杂的数学方程式,帮助他们解决与语言相关的任务,例如预测文本序列中的缺失单词。通常,您为深度学习模型提供的质量训练数据越多,执行任务的能力就越高。

根据OpenAI,GPT-2已经接受了800万个网页和数十亿字的培训,这比其他类似的模型要多得多。它还使用高级AI模型来更好地应用文本模式。来自GPT-2的样本输出显示该模型设法在比其前辈更长的文本序列中保持一致性。

虽然GPT-2在自然语言生成领域向前迈进了一步,但它并不是创造能够理解书面文本的意义和背景的人工智能的技术突破。GPT-2仍在使用算法创建单词序列,这些单词在统计上与之前看到的数十亿文本摘录相似 - 它完全不了解它产生的内容。

在深入分析中,ZDNet的Tiernan Ray指出了GPT-2的输出样本背叛其人为性质的几个例子,其中包括术语重复和缺乏逻辑以及事实一致性等众所周知的文物。“当GPT-2继续处理需要更多思想和逻辑发展的写作时,裂缝会在相当宽的范围内突破,”雷指出。

统计学习可以帮助计算机生成语法正确的文本,但需要更深入的概念理解来保持逻辑和事实的一致性。不幸的是,目前AI的混合物还没有克服,这仍然是一个挑战。这就是为什么GPT-2可以生成漂亮的文本段落,但可能很难生成一个真实的长篇文章或以令人信服的方式和长时间冒充某人。

为什么AI虚假 - 新闻恐慌被夸大了

OpenAI推理的另一个问题:它假设AI可以创造假新闻危机。

2016年,一群马其顿青少年向数百万人传播有关美国总统大选的假新闻。具有讽刺意味的是,他们甚至没有适当的英语技能; 他们在网上找到自己的故事,并将不同的内容拼接在一起。他们之所以成功,是因为他们创建的网站看起来很真实,可以说服访问者相信他们是可靠的新闻来源。引人注目的头条新闻,疏忽的社交媒体用户和趋势算法完成了其余的工作。

然后在2017年,恶意演员通过攻击卡塔尔国营新闻网站和政府社交媒体账户,并代表卡塔尔埃米尔的谢赫塔米姆·本·哈马德·阿勒萨尼发表虚假言论,引发了波斯湾地区的外交危机。

正如这些故事所表明的那样,假新闻活动的成功取决于建立(和背叛)信任,而不是产生大量连贯的英文文本。

然而,OpenAI关于自动生成虚假内容以在社交媒体上发布的警告更为合理,因为规模和数量在社交网​​络中比在传统媒体中扮演更重要的角色。假设GPT-2等人工智能将能够在社交媒体上涌现数百万个关于特定主题的独特帖子,从而影响趋势算法和公众讨论。

但是,警告仍未达到现实。在过去几年中,社交媒体公司一直在不断开发检测和阻止自动行为的功能。因此,一个拥有文本生成AI的恶意行为者必须克服许多挑战,而不是创造独特的内容。

例如,他们需要数以千计的假社交媒体帐户来发布他们生成AI的内容。更难的是,为了确保无法连接虚假账户,他们需要为每个账户提供唯一的设备和IP地址。

情况变得更糟:帐户必须在不同的时间创建,可能超过一年或更长时间,以减少相似之处。去年,“纽约时报”的一项调查显示,仅凭帐户创建日期就可以帮助发现僵尸帐户。然后,为了进一步隐藏其他用户和警务算法的自动化性质,帐户必须进行类似人类的行为,例如与其他用户交互并在帖子中设置独特的语气。

这些挑战都无法克服,但它们表明,内容只是社交媒体虚假新闻活动中所需努力的一部分。再一次,信任起着重要作用。一些可信赖的社交媒体影响者发布一些虚假新闻帖子将产生比产生大量内容的一堆未知帐户更大的影响。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章