羿阁发自凹非寺

量子位 | 公众号 QbitAI

一款新的聊天AI被网友们玩疯了。

能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住，它就是OpenAI刚刚推出的——ChatGPT。

有脑洞大开的网友甚至用它来设计游戏：先用ChatGPT生成游戏设定，再用Midjourney出图，简直是AI生产力一条龙了。

有人还将ChatGPT的回复与谷歌搜索结果对比，惊讶地发现ChatGPT在实用性上强太多：谷歌这是要凉啊。

甚至有人预言如果谷歌不做出改变很快就会被淘汰，到时候自己愿意每月花15-20美元使用ChatGPT。

不过好消息是，目前ChatGPT正处于免费试用阶段，有条件的小伙伴可以赶紧试试。（链接放在文末）

ChatGPT有多神奇？

有网友分别问谷歌和ChatGPT“如何使用Latex表示微分结果”，相较于谷歌中规中矩的回答：

ChatGPT则是一下给出了直接可用的代码，你只需动动手复制粘贴即可：

还有人让ChatGPT给出冒泡排序的最坏时间复杂度，并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来，也被ChatGPT轻松拿捏：

直接问下面代码的bug是啥，ChatGPT也能给你说得明明白白：

除了计算机，ChatGPT在其他领域表现也很出色，比如它还能AI在线问诊。

当你告诉它自己得了皮疹，并且呼吸困难，感觉很虚弱时，ChatGPT会像医生一样为你分析病因，并建议你比起吃药，更需要戒烟、多锻炼。

与搜索引擎里需要小心分辨的医疗广告对比，可以说很贴心了。

还有许多机智的网友，像上文提到的那样，用ChatGPT来搞设计。

比如这位网友让ChatGPT给自己设计卧室，然后用它给出的文字做提示词，去MidJourney生成图像，连请设计公司的钱都省了。

那么，介绍了这么多，ChatGPT背后原理究竟是什么？

背后原理

顾名思义，ChatGPT是在GPT-3.5系列中的一个模型上进行微调而成，该系列已在2022年初完成了训练。

它以对话方式进行交互，既能够做到回答问题，也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。

与OpenAI今年初发布的InstructGPT一样，ChatGPT也是使用强化学习进行训练，但在数据收集设置上有所区别。

在模型训练中，OpenAI使用监督微调：训练者提供对话样本，扮演对话的双方，即用户和AI助手。

除此之外，训练者还可以访问模型编写的建议，帮助他们撰写答案。

为了创建强化学习的奖励模型，研究团队需要收集比较数据，为此，他们随机选择模型编写的信息，对替代结果进行抽样，再让训练者对样本进行排名。

通过上述的奖励模型和近端策略优化对模型进行微调，并执行了此过程的多次迭代，最后得出了该模型。

不过别看它在许多方面表现都很出色，研究人员也承认现阶段ChatGPT还存在一些bug。

举个例子，有网友在多次尝试后就指出，ChatGPT经常会过度使用某些短语，比如反复重申“自己是由OpenAI训练的语言模型”。

除此之外，有时候ChatGPT的回答过于冗长，甚至当网友告诉它自己需要更短一点的回答时，它反而说的更多了。

还有理性的网友指出，ChatGPT想要替代谷歌也没那么容易。

一位在Alphabet工作的网友就现身说法，谷歌也不是没有考虑过在搜索引擎中引用大模型，但最大的问题是成本太高了。

如果要对用户收费的话，价格很可能高达150~200美元每月，恐怕没有几个人愿意支付这笔钱。

不过，OpenAI的CEO萨姆·阿尔特曼（Sam Altman）对ChatGPT的未来发展表示很有信心：

他表示，语言接口将是未来的一个发展方向，而ChatGPT就是为大家先打了个样，相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。

话说回来，你还想到了ChatGPT哪些好玩的用途？

有条件的小伙伴赶紧戳下面链接试试吧～

指路链接：

https://chat.openai.com/

参考链接：

[1]https://twitter.com/sama/status/1598038818472759297 [2]https://news.ycombinator.com/item?id=33817682[3]https://twitter.com/jdjkelly/status/1598021488795586561

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

ChatGPT有多神奇？

背后原理

相关文章

Leave a Reply Cancel reply