羿阁 发自 凹非寺

量子位 | 公众号 QbitAI

一款新的聊天AI被网友们玩疯了。

能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住,它就是OpenAI刚刚推出的——ChatGPT

有脑洞大开的网友甚至用它来设计游戏:先用ChatGPT生成游戏设定,再用Midjourney出图,简直是AI生产力一条龙了。

有人还将ChatGPT的回复与谷歌搜索结果对比,惊讶地发现ChatGPT在实用性上强太多:谷歌这是要凉啊。

甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花15-20美元使用ChatGPT。

不过好消息是,目前ChatGPT正处于免费试用阶段,有条件的小伙伴可以赶紧试试。(链接放在文末)

ChatGPT有多神奇?

有网友分别问谷歌和ChatGPT“如何使用Latex表示微分结果”,相较于谷歌中规中矩的回答:

ChatGPT则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:

还有人让ChatGPT给出冒泡排序的最坏时间复杂度,并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来,也被ChatGPT轻松拿捏:

直接问下面代码的bug是啥,ChatGPT也能给你说得明明白白:

除了计算机,ChatGPT在其他领域表现也很出色,比如它还能AI在线问诊。

当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,ChatGPT会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。

与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。

还有许多机智的网友,像上文提到的那样,用ChatGPT来搞设计。

比如这位网友让ChatGPT给自己设计卧室,然后用它给出的文字做提示词,去MidJourney生成图像,连请设计公司的钱都省了。

那么,介绍了这么多,ChatGPT背后原理究竟是什么?

背后原理

顾名思义,ChatGPT是在GPT-3.5系列中的一个模型上进行微调而成,该系列已在2022年初完成了训练。

它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。

与OpenAI今年初发布的InstructGPT一样,ChatGPT也是使用强化学习进行训练,但在数据收集设置上有所区别。

在模型训练中,OpenAI使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和AI助手。

除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。

为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。

通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。

不过别看它在许多方面表现都很出色,研究人员也承认现阶段ChatGPT还存在一些bug。

举个例子,有网友在多次尝试后就指出,ChatGPT经常会过度使用某些短语,比如反复重申“自己是由OpenAI训练的语言模型”。

除此之外,有时候ChatGPT的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。

还有理性的网友指出,ChatGPT想要替代谷歌也没那么容易。

一位在Alphabet工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。

如果要对用户收费的话,价格很可能高达150~200美元每月,恐怕没有几个人愿意支付这笔钱。

不过,OpenAI的CEO萨姆·阿尔特曼(Sam Altman)对ChatGPT的未来发展表示很有信心:

他表示,语言接口将是未来的一个发展方向,而ChatGPT就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。

话说回来,你还想到了ChatGPT哪些好玩的用途?

有条件的小伙伴赶紧戳下面链接试试吧~

指路链接:

https://chat.openai.com/

参考链接:

[1]https://twitter.com/sama/status/1598038818472759297 [2]https://news.ycombinator.com/item?id=33817682[3]https://twitter.com/jdjkelly/status/1598021488795586561

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

Leave a Reply

Your email address will not be published. Required fields are marked *