首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

李开复披露大模型创业进展:开源、To C、超级应用方法论

第一财经 2023-11-06 18:42:25 听新闻

作者:吕倩    责编:李娜

李开复以抖音与微信举例称,两款产品规模化与利润率以及收入质量都高于大部分做商业、做系统集成、做To B业务的公司,所以零一坚定不移走消费者端To C路径。

11月6日,零一万物创始人及CEO李开复带队创办的AI 2.0公司零一万物,正式发布首款开源预训练大模型 Yi-34B。

截至目前,国内外大模型开源平台此起彼伏,如Meta大型语言模型LLama 2,阿里云Qwen-7B、Qwen-14B,百川智能Baichuan2-7B、Baichuan2-13B等。

对于大模型开源平台之间的同质化竞争问题,李开复对第一财经记者表示,有竞争才会有进步,如Hugging Face这样的开源社区,作为独立第三方进行测试,其测试结果会让外界产生自然的关注。但如果只是千家、万家公司每家都做一个没什么价值的开源模型,那这个社区就乱了。

通过竞争可以进行开放式的、公平的对比,让行业知道哪些开源模型是最好的。因此,李开复认为开源模型的发布就是一个验证开源社区与开源方法论的尝试。

Hugging Face作为AI领域的Github,提供大量开源模型与工具。根据 Hugging Face 英文开源社区平台和C-Eval 中文评测的最新榜单,Yi-34B预训练模型取得多项SOTA国际最佳性能指标认可。

此次零一万物开源发布的Yi系列模型,包含34B和6B两个版本。其中开源的Yi-34B模型将发布全球最长、可支持200K 超长上下文窗口(context window)版本,可以处理约40万汉字超长文本输入。此前OpenAI的GPT-4上下文窗口只有32K,文字处理量约2.5万字。今年3月,硅谷 AI 2.0 创业公司Anthropic的Claude2-100K 将上下文窗口扩展到了100K规模。

对于优先选择34B训练及开源的原因,李开复表示,34B是一个黄金尺寸,虽然6B也可以做出在部分垂直领域应用的模型,但模型越大越好,当然也伴随着推理成本与训练成本增加所带来的GPU资源耗费。而34B作为一个黄金尺寸,不会小到没有涌现或涌现不够,又不会过大,允许高效率的单卡推理,且该类推理并不需要H或A级别显卡,甚至RTX4090或3090便足够。既满足精度要求,实现训练成本友好,又能达到涌现门槛,属于非常多商业应用均适配的程度。

对于大模型的具体落地商业化方向,李开复明确其为To C领域,他认为AI2.0时代最大的商机是创造超级应用 Super APP。李开复将超级应用定位为大部分人需要花大部分时间、每天必须用它才能得到价值体现或学到新技术的产品。同时如果将该应用内的大模型拿掉了,整个应用就不成立。

例如李开复虽然认为微软Copilot是很有价值的产品,但未来消费者所使用的office,一定不是在今天的office基础上去堆积功能,而是一个从零做起的东西。也就是说内容的创造不是由人来创造,再由AI来帮一点小忙,而应主要是由AI来创造,人来帮忙,这才是王道。

当然,李开复补充称,零一现阶段不可能自己便将所有的超级应用都做了,因为应用一定是一个简单的开始,再通过精益创业的方法不断迭代,就像抖音和微信的第一个版本并不是超级应用,而是捕捉到用户的需求,同时通过新平台的技术精髓来做一个大家都喜欢的简单应用,然后不断根据用户反馈进行调整,最终迭代成超级应用,这是零一万物做超级应用的方法论。

目前零一所发布版本以文字为主,但多模态仍是努力方向。李开复表示,零一万物目前在多模态方面已有超过十个人的团队,目前美国在多模态领域已进入白热化竞争状态,如DALL-E3、GPT-4V,还有即将推出的谷歌 Gemini,都将多模态作为两家公司最大的竞争关注领域,零一肯定也要参与这一竞赛。

至于大模型落地应用之后的商业化问题,在AI1.0时代投过许多AI创业公司的李开复总结认为,AI1.0的公司所面临的挑战,一是收入没有做好,二是收入没做到可持续,许多AI1.0时代的收入问题做不好的公司很早就被淘汰了。他仍旧以抖音与微信举例称,两款产品规模化与利润率以及收入质量都高于大部分做商业、做系统集成、做To B业务的公司,所以零一坚定不移走消费者端To C路径。

目前零一万物团队成员主要来自Google、微软、阿里巴巴、百度、字节跳动、腾讯等国内外企业,零一万物技术副总裁及AI Alignment负责人是 Google Bard/Assistant 早期核心成员,主导参与了从 Bert、LaMDA 到大模型在多轮对话、个人助理、AI Agent 等多个方向的研究和工程落地;首席架构师曾在Google Brain与Jeff Dean、Samy Bengio等合作,为TensorFlow的核心创始成员之一。

接下来,零一万物将基于Yi 基座模型,快节奏开源发布一系列量化版本、对话模型、数学模型、代码模型和多模态模型等,邀请开发者加入,培育新型“AI-first”创新生态体系。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

相关阅读

用户需要怎样的行业大模型?︱AI大模型十问(六)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-30 15:28

书生·浦语2.0正式开源,回归语言建模本质,综合性能领先开源社区

1月17日,书生·浦语2.0(InternLM2)发布会暨书生·浦源大模型挑战赛启动仪式在上海举行。

01-18 14:15

2023年国内大模型发展盘点(一)——大模型发展趋势

“十四五”期间,国家出台了针对人工智能的未来发展相关指导方案和激励政策,涵盖“新型基础设施”建设、人工智能标准化与法规以及AI安全体系建设等。过去的2023年作为承上启下之年,如何总结评估前期成果并调整优化策略将成为规划实施的重要一环。而大语言模型作为人工智能领域最引人注目的成果之一,近年来已经经历了迅速崛起的历程,2020年Open AI GPT-3模型的发布更是极大推动了公众对于大语言模型的关注度。本系列文章将分别回顾2023年国内大模型发展重要趋势,比对中美大模型发展水平明确自身缺陷及劣势,并针对未来国内大模型发展给出针对性建议。本文将概括2023年国内大模型发展重点趋势,分别从模型规模、应用场景、技术创新、跨模态大模型以及产业化角度介绍年度发展。

01-14 22:55

行业大模型如何降本?︱十问AI大模型(三)

编者按:ChatGPT爆火后,AI大模型层出不穷,面向行业的垂直大模型也陆续发布。那么,怎么才算一个合格的行业大模型?行业数据哪里来?如何将行业know how更好地融入大模型?第一财经推出“十问AI大模型”专题,进一步追问与解密。

01-09 15:05

国内大模型创新发展与软硬件协同生态论坛在上海徐汇成功举办

2023年12月28日下午,国内大模型创新发展与软硬件协同生态论坛在上海徐汇成功举办。

01-02 14:07
一财最热
点击关闭