《困惑度揭秘：人工智能助手GPTZero如何识别文章作者》

解锁AI未来，与智慧同行！关注公众号，获取前沿AI资讯，体验尖端AI工具，让智能科技改变您的生活！

aigc%E6%8E%A2%E7%B4%A2_%E5%8E%8B%E7%BC%A920k.png

文章主题：perplexity, NLP, GPTZero, 文字困惑度

来源：量子位QbitAI官方澎湃号

自从ChatGPT去年底发布以来，在美国很多大学生和中学生用它帮助写作文和做功课，因此在很多大学和中学里老师们开始禁止学生使用它，称它会培养学生作弊和抄袭的恶行。

前几天连香港的大学也出台类似的禁止条例。但是这些学校和老师们不知道，现在已经有个工具，让老师们可以简单地把学生的论文输入，它会马上告诉老师，这篇文章是否是用ChatGPT帮助写的。现在这个工具已经在美国媒体引起轰动，被大量报道。

这个工具的开发者，是一位只有22岁的在普林斯顿大学就读的学生，据说还是一个华裔，他的名字叫爱德华·田 (Edward Tian)。这位天才学生在今年新年之际别人喝酒放焰火庆祝新年时，他连夜赶工自己编写程序开发出了这个工具，叫做GPTZero (让ChatGPT的功能归零的意思), 并建立了给公众使用的网站，颇有像盖茨和小扎等很多天才创业者们早年在校创业的形象。

现在这个工具得到了全美很多高校和中学老师们的赞赏和捧场，这位天才少年也成了老师们追捧的明星。网上也出现了各种有趣的漫画，宣传如何用这个工具来抓作弊的学生们，包括“一枪击毙ChatGPT”的漫画等。

但它也引来了大批学生们的各种开玩笑的咒骂，美国抖音社交媒体上有人写了这些有趣的评论： “我还没毕业呐，你就做了这个，让我以后如何过日子”, “这位爱德华一定是老师们养的宠物”，“他是用了ChatGPT编的这个程序吧”，最受欢迎的评论是 “他是第一号全民公敌” 还有人出了视频介绍他要如何再去蒙骗这个工具。

爱德华是如何实现对ChatGPT这个论文枪手的判断的呢？

它主要靠“perplexity”，即文本的“困惑度”作为指标来判断所给内容到底是谁写的。

NLP领域的朋友们都知道，这个指标就是用来评价一个语言模型的好坏的。

在这里，每当你喂给GPTZero一段测试内容，它就会分别计算出：

1、文字总困惑度

这个值越高，就越可能出自人类之手。

2、所有句子的平均困惑度

句子越长，这个值通常就越低。

3、每个句子的困惑度

通过条形图的形式展示，您可以将鼠标移至各个方块上，从而查看到对应的句子信息。在此示例中，由于您仅提供了两个句子作为测试内容，因此只显示了两个方块。

之所以要绘制这样的条形图，作者也作出了解释：

根据最近的研究表明，人类在书写过程中所形成的句子，其困惑度相对较低。然而，随着 writing 过程的不断展开，困惑度很可能会逐渐达到一个峰值。

相反，用机器生成的文本，其困惑度是均匀分布的，并且总是很低。

除此之外，GPTZero还会挑出困惑度最高的那个句子（也就是最像人写的）：

真的那么神奇么？实际测一测。

首先来一段最新的英文新闻（目前还不支持测中文）：

将它粘贴进测试框（需注意每句至少5个单词，建议每段能有10个句子，结果会更准一些）。

GPTZero迅速计算出该段文字的总文字困惑度达到了27，而句子平均困惑度则高达171.2。每条句子的困惑度图表均呈现如下样式：

以及困惑度最高的句子的值为476。

看这个结果，估计你也猜出了GPTZero的答案：

这是人类写的。

再来一段ChatGPT的。

在输入文本到测试框后，经过分析，我们发现这段文字的总文字困惑度达到了31，而句子平均困惑度更是高达76.67。这一结果显然表明，这段文字并非出自人类之手。

爱德华·田现在微软实习，曾在BBC、贝灵猫等公司撰写过科技稿件，还曾加入到地图工具Representable的创始团队。

学习期间，他曾来到清华大学参加为期四周的城市研究研讨会。

据他表示，这个应用程序是新年假期在咖啡店完成的。

对于开发该款应用程序的初衷，简单来说，是因为市场上充斥着太多的ChatGPT炒作出来的内容，而人们却没有足够的认识去分辨哪些是由人工智能创作的。

目前仍处于准系统阶段，预计在接下来几周内改进模型和分析。

除此之外，他还透露，正在测试由学生撰写的新闻文章数据集，并希望最终能发表论文。

事实上，ChatGPT的不满情绪并非只针对个体表现，许多人类组织也纷纷开发相应的AI技术来对抗它。这些组织致力于开发AI文本检测器，也被称为“ChatGPT杀手”。

大体思路也都差不多，那就是“用魔法打败魔法”，用AI写的东西来训练新AI。

最近，OpenAI与哈佛等知名学府联手开发出一款名为GPT-2 Output Detector的检测器。

作者们首先推出了一份由GPT-2生成的内容以及一个名为WebText的数据集。这个WebText数据集是从国外的Reddit贴吧中获取的，专门用于让AI理解“AI语言”与“人话”之间的差别。

随后，用这个数据集对RoBERTa模型进行微调，就得到了这个AI检测器。其中人话一律被识别为True，AI生成的内容则一律被识别为Fake。

但也有人表示，文本检测器根本就是一场失败的军备竞赛，他们的实际效果并不好。也阻挡不了ChatGPT的发展。

与此同时，还有网友探讨起关于“文章是否需要明确指示由AI还是人类编写”的必要性。

有位词曲创作者认为，这是有必要的，就像在看杂志时会标注“广告”，这应该是一个简单的要求。

但有网友立即表示反对，为什么要设置障碍？这就跟使用PS然后加上Adobe水印，对产品没有任何益处。

对于这个问题，你怎么看呢？

perplexity, NLP, GPTZero, 文字困惑度

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

图表工具视频

相关文章

Leave a Reply Cancel reply