焦点热门:爆火出圈的ChatGPT原理是什么,它真的有那么“神乎其神”吗?

来源:科普中国

AI绘画最近火了,它的水平不亚于厉害的画师。而最近,AI开始学会写文章了,陪你聊天、学习,当你的生活和工作的“百科全书”,它就是ChatGPT。

今天我们就来一起认识一下,仿佛拥有自己的逻辑思维能力的ChatGPT,是怎样做到对答自如,写出优秀的文章的。ChatGPT是一款由美国人工智能研究公司OpenAI公司打造的聊天软件,目前还在测试阶段,向大众免费开放,钢铁侠马斯克也是OpenAI的投资人之一。ChatGPT是一种自然语言处理技术,它可以进行自然语言理解和生成,能够和我们人类进行有意义的对话。它的出现,意味着我们可以使用自然语言交互来做更多的事情,比如ChatGPT可以帮助我们完成复杂的任务、进行自然语言处理、以及让计算机与人类更好地沟通。


(相关资料图)

什么意思呢?就是说这种技术可以为我们答疑解惑,而且这个答案并非是预定输入的,是它根据已有的知识和逻辑思维“想”出来的,就像一个会思考动脑子的人一样。更进一步来说,你可以让ChatGPT为你出主意、整理某个人的生平资料,介绍他甚至把他写成一篇文章。

如此智慧的一款软件,它是怎么被打造出来的?简单地说,它是被训练出来的。

首先呢,开发团队使用了一种叫做“人类反馈强化学习”(RLHF)的机器学习技术对ChatGPT进行了训练。什么叫做训练?我们简单来了解一下AI领域中,一款软件是怎么被训练出来的。我给大家举一个经典的例子:要让AI分析出一张图片上是人还是动物,AI会将图片上的每一个像素点作为输入的一个信息,这些信息在经过AI的迭代计算后形成一个算法,最后输出一个“是人”或者“是动物”的结果。在识别了大量人或动物的图片后,AI就经过了“训练”,就能从中学习到人和动物的关键信息,从而对新照片是人还是动物做出判断。基于这种方法,OpenAI的开发团队训练出了ChatGPT的初始模型。

接下来就是优化了。他们让AI训练人员模拟用户端,与人工智能进行对话,在不断的对话过程中对ChatGPT的代码进行调试和优化。

这个时候,研究人员开始思考一个问题——怎么让它学得更快、更加接近我们所寻求的结果?他们想到了一个好办法,把ChatGPT当做一个正在学习的小孩,告诉他“考试考得好,我就给你糖吃。”在AI领域,这种办法有个专业名称,叫做强化学习的奖励模型(reward modeling)。奖励模型虽然不是真的给AI吃的糖,而是一个编程函数,但是它能让AI的算法“明白”什么情况下的回答才是更好的。通过这种策略,让ChatGPT越来越优秀和智能。

经过层层打造的ChatGPT现在能用来干嘛呢?

咱们来简单举个例子,如果我问ChatGPT,你能为我写一篇介绍ChatGPT的科普文章吗? 它就会根据我不同的要求,进行不同的“思考”,从而给出不同的答案。无论是什么领域的问题,ChatGPT都能给出一番见解。比如,我们对生物医药领域和电力系统控制领域两个方面都提个问题,它也能很好地回答,甚至还能帮程序员找出代码中的BUG。

怎么样,是不是非常地神奇?实际上它会的比你想象的更多。

最近,在德国一家咨询公司的托拜厄斯·茨温(Tobias Zwingmann)经常用ChatGPT生成讲义,让它解释一种被称为DBSCAN的机器学习技术的机制和工作原理,因为茨温“懒得把它全部写下来。”无独有偶,Ironclad公司的首席技术官Cai GoGwilt表示,他的公司正在探索如何使用ChatGPT来总结法律条文的变化。GoGwilt认为“这个功能对我们的客户很有帮助”。可见,ChatGPT并不只是一款简单的智能聊天软件,它还能用来做更高级的事——解释技术原理、总结法律条文的变化等。当然啦,目前ChatGPT还在测试阶段,而发团队也指出了它现在还有一定的局限性。

第一,ChatGPT有时候会给出似是而非的答案,不一定是我们想要的答案,这一点解决起来还是比较有挑战性的。

第二,有的时候,我们用某种措辞向GhatGPT提问时,它可能会说自己不知道答案是什么,但是如果你稍微换一下描述的方法,它就可以正确地回答出来。这一点上GhatGPT还有点“不够聪明”。

第三,理想情况下,当我们提出的问题不够明确时,AI应该会向我们再次确认问题是什么,避免产生歧义,但是ChatGPT做不到,它通常会自己去猜测用户的意图,然后给出答案。

但优秀的技术和产品往往需要时间去验证。相信经过时间的淬炼和科学家的努力,ChatGPT会越来越好,我们也期待它的上市能给人们的生活带来新的精彩。

本文为科普中国·星空计划扶持作品

团队名称:深究科学

审核:李永华

出品:中国科协科普部

监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

关键词:

推荐

精彩放送

创投更多》

科技更多》

云计算