首页 > 新闻 > 科技

分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

周鸿祎谈大模型扎堆：现在说超越ChatGPT的叫吹牛

第一财经 2023-05-07 22:01:22

作者：吕倩责编：刘佳

一天前科大讯飞发布讯飞星火认知大模型，称已经在文本生成、知识问答、数学能力三大能力上超过ChatGPT。

跨入东方甄选直播间的第一件事，三六零(601360.SH，简称“360”)集团创始人周鸿祎先尝了尝桌上摆放了零食。

5月7日，周鸿祎连轴转场俞敏洪与东方甄选直播间，销售其名下两本书——《超越好奇》《数字安全网络战》。在东方甄选直播间不足十分钟的时间内，《超越好奇》的销量已超过在俞敏洪直播间一个半小时的销售量。

周鸿祎在东方甄选直播间内顺应了董宇辉的主播风格，主要以闲聊为主，浅谈了何为创业、年轻人的好奇心等。在俞敏洪直播间内，周鸿祎谈及对当下火热大模型与ChatGPT的看法，他称，以前的人工智能技术很碎片，“不通用”的问题导致大家对它丧失了热情。

OpenAI的成功让行业热议是否过去中国公司过于“功利”地追求盈利，而不愿长期投入技术。对此，周鸿祎认为，这是因为公司都比较现实，美国公司也一样，Meta(NASDAQ:META)搞元宇宙亏了100亿美元也受不了，OpenAI最牛的一点就是坚信通用人工智能能成功，且最终把这条路给趟出来了，这里面既有运气也有坚持。

至于目前国内多家公司密集推出大模型产品的现象，周鸿祎称，首先要感谢OpenAI与ChatGPT把方向跟技术路线探索出来了，第二要感谢开源生态与开放论文，剩下留给公司们要做的主要是工程化的训练层面，这是当下大家都能做大模型的原因。

至于目前国内大模型发展与OpenAI之间的差距，周鸿祎称他同意王小川的观点——差距最少有两年。此前王小川认为OpenAI比国内领先三年时间。追上GPT-3.5可能一年时间是有机会的，但目前OpenAI已经达到GPT-4的级别，GPT-5也在训练过程当中了，因此“追上”需要三年。

回到国内大模型发展问题，周鸿祎表示，互联网公司都去做大模型的原因，是因为没人能笃定某一家公司能做出来成功的大模型产品。但这个技术对中国很重要，它是工业级的，对各行各业都能带来工业革命级的推动。但在早期，周鸿祎认为后来者在大模型技术领域肯定是模仿与“抄袭”，但在做的过程中一定会越来越了解，未来有可能会弯道超车、后来者居上，“但上来就说能超越，那才叫吹牛呢”，周鸿祎表示。

5月6日，科大讯飞(002230.SZ)推出星火认知大模型，科大讯飞董事长刘庆峰表示，认知大模型成为通用人工智能的曙光，科大讯飞有信心实现“智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上超过ChatGPT。

“到今年的10月24日（科大讯飞全球开发者节），我们希望星火能够在通用认知大模型能力上对标ChatGPT，在中文上超越ChatGPT，在英文上达到跟它相当的水平。”刘庆峰表示。

此前360推出大模型产品“360智脑”，在俞敏洪直播间，周鸿祎也对“360智脑”进行了多模态演示。在制图环节，“360智脑”完成了周鸿祎与俞敏洪合照、松鼠喝啤酒等要求，但在制作“俞敏洪喝啤酒”图片环节发生卡顿，据了解是因“360智脑”储备俞敏洪图片不足所致。

5月5日收盘，360股价15.45元，涨2.73%，总市值1104亿元。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com