解锁AI未来,与智慧同行!关注公众号,获取前沿AI资讯,体验尖端AI工具,让智能科技改变您的生活!

aigc%E6%8E%A2%E7%B4%A2_%E5%8E%8B%E7%BC%A920k.png

文章主题:perplexity, NLP, GPTZero, 文字困惑度

666AI工具大全,助力做AI时代先行者!

来源:量子位QbitAI官方澎湃号

自从ChatGPT去年底发布以来,在美国很多大学生和中学生用它帮助写作文和做功课,因此在很多大学和中学里老师们开始禁止学生使用它,称它会培养学生作弊和抄袭的恶行。

前几天连香港的大学也出台类似的禁止条例。但是这些学校和老师们不知道,现在已经有个工具,让老师们可以简单地把学生的论文输入,它会马上告诉老师,这篇文章是否是用ChatGPT帮助写的。现在这个工具已经在美国媒体引起轰动,被大量报道。

1701508231818.jpg

这个工具的开发者,是一位只有22岁的在普林斯顿大学就读的学生,据说还是一个华裔,他的名字叫爱德华·田 (Edward Tian)。这位天才学生在今年新年之际别人喝酒放焰火庆祝新年时,他连夜赶工自己编写程序开发出了这个工具,叫做GPTZero (让ChatGPT的功能归零的意思), 并建立了给公众使用的网站,颇有像盖茨和小扎等很多天才创业者们早年在校创业的形象。

现在这个工具得到了全美很多高校和中学老师们的赞赏和捧场,这位天才少年也成了老师们追捧的明星。网上也出现了各种有趣的漫画,宣传如何用这个工具来抓作弊的学生们,包括“一枪击毙ChatGPT”的漫画等。

但它也引来了大批学生们的各种开玩笑的咒骂,美国抖音社交媒体上有人写了这些有趣的评论: “我还没毕业呐,你就做了这个,让我以后如何过日子”, “这位爱德华一定是老师们养的宠物”,“他是用了ChatGPT编的这个程序吧”,最受欢迎的评论是 “他是第一号全民公敌”  还有人出了视频介绍他要如何再去蒙骗这个工具。

爱德华是如何实现对ChatGPT这个论文枪手的判断的呢?

它主要靠“perplexity”,即文本的“困惑度”作为指标来判断所给内容到底是谁写的。

NLP领域的朋友们都知道,这个指标就是用来评价一个语言模型的好坏的。

在这里,每当你喂给GPTZero一段测试内容,它就会分别计算出:

1、文字总困惑度

这个值越高,就越可能出自人类之手。

2、所有句子的平均困惑度

句子越长,这个值通常就越低。

1701508231928.jpg

3、每个句子的困惑度

通过条形图的形式展示,您可以将鼠标移至各个方块上,从而查看到对应的句子信息。在此示例中,由于您仅提供了两个句子作为测试内容,因此只显示了两个方块。

1701508232004.jpg

之所以要绘制这样的条形图,作者也作出了解释:

根据最近的研究表明,人类在书写过程中所形成的句子,其困惑度相对较低。然而,随着 writing 过程的不断展开,困惑度很可能会逐渐达到一个峰值。

相反,用机器生成的文本,其困惑度是均匀分布的,并且总是很低。

除此之外,GPTZero还会挑出困惑度最高的那个句子(也就是最像人写的):

1701508232059.jpg

真的那么神奇么?实际测一测。

首先来一段最新的英文新闻(目前还不支持测中文):

1701508232148.jpg

将它粘贴进测试框(需注意每句至少5个单词,建议每段能有10个句子,结果会更准一些)。

GPTZero迅速计算出该段文字的总文字困惑度达到了27,而句子平均困惑度则高达171.2。每条句子的困惑度图表均呈现如下样式:

1701508232226.jpg

以及困惑度最高的句子的值为476。

看这个结果,估计你也猜出了GPTZero的答案:

这是人类写的。

再来一段ChatGPT的。

1701508232326.jpg

在输入文本到测试框后,经过分析,我们发现这段文字的总文字困惑度达到了31,而句子平均困惑度更是高达76.67。这一结果显然表明,这段文字并非出自人类之手。

1701508232504.jpg

爱德华·田现在微软实习,曾在BBC、贝灵猫等公司撰写过科技稿件,还曾加入到地图工具Representable的创始团队。

学习期间,他曾来到清华大学参加为期四周的城市研究研讨会。

据他表示,这个应用程序是新年假期在咖啡店完成的。

对于开发该款应用程序的初衷,简单来说,是因为市场上充斥着太多的ChatGPT炒作出来的内容,而人们却没有足够的认识去分辨哪些是由人工智能创作的。

目前仍处于准系统阶段,预计在接下来几周内改进模型和分析。

除此之外,他还透露,正在测试由学生撰写的新闻文章数据集,并希望最终能发表论文。

事实上,ChatGPT的不满情绪并非只针对个体表现,许多人类组织也纷纷开发相应的AI技术来对抗它。这些组织致力于开发AI文本检测器,也被称为“ChatGPT杀手”。

大体思路也都差不多,那就是“用魔法打败魔法”,用AI写的东西来训练新AI。

最近,OpenAI与哈佛等知名学府联手开发出一款名为GPT-2 Output Detector的检测器。

作者们首先推出了一份由GPT-2生成的内容以及一个名为WebText的数据集。这个WebText数据集是从国外的Reddit贴吧中获取的,专门用于让AI理解“AI语言”与“人话”之间的差别。

随后,用这个数据集对RoBERTa模型进行微调,就得到了这个AI检测器。其中人话一律被识别为True,AI生成的内容则一律被识别为Fake。

但也有人表示,文本检测器根本就是一场失败的军备竞赛,他们的实际效果并不好。也阻挡不了ChatGPT的发展。

与此同时,还有网友探讨起关于“文章是否需要明确指示由AI还是人类编写”的必要性。

有位词曲创作者认为,这是有必要的,就像在看杂志时会标注“广告”,这应该是一个简单的要求。

但有网友立即表示反对,为什么要设置障碍?这就跟使用PS然后加上Adobe水印,对产品没有任何益处。

对于这个问题,你怎么看呢?

perplexity, NLP, GPTZero, 文字困惑度

aigc666aigc999_4.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *