分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

华东师范大学计算机学院副研究员董道国：大模型正在成为生产力，“场景找技术”更易成功

第一财经 2024-03-27 20:03:41 听新闻

作者：冯丽君 ▪ 魏晓责编：黄宇

企业应综合考虑是微调一个大模型，还是构建一个面向自己行业应用的智能体。

自2022年11月底openAI首次公测ChatGPT以来，人工智能（AI）迎来新一波浪潮，AI产业飞速发展。

“AI在这段时间的发展可以用‘波澜壮阔’来形容。在此前的很长一段时间里，人们其实对AI持一种保留甚至怀疑的态度，直到ChatGPT发布后，人们才发现人工智能真的能够成为一种生产力。”华东师范大学计算机学院副研究员、前华为荣耀Magic手机首席架构师董道国近日对第一财经表示，“这种生产力仍然局限在小范围内，还没有真正颠覆各行各业，但至少这个趋势已经出现了，目前已是暗潮涌动。”

以下为部分交流内容：

第一财经：目前国内的大模型能否对标OpenAI的ChatGPT？

董道国：国内大模型的发展蒸蒸日上，但距离OpenAI发布的GPT4等领先大模型，国内还有很长的路要走，还需要更加努力，特别是那种有资金、有实力的大厂，应该再沉下心来继续努力，至少到目前为止这种差距还是比较大的。

第一财经：这个差距具体体现在哪里？

董道国：这是综合性的表现，大模型不仅仅是算法，还要考虑训练数据、算力以及工程化能力。如果仅仅聚焦于对话模型，国内大模型对中文对话的支持还是可以的，但如果把大模型作为AI Agent（人工智能体）的“大脑”作用去发挥的时候，我们的大模型在推理能力上距离ChatGPT还有蛮远的距离，也就是说仅仅看对话模型其实表现也还可以，但是将AI作为一个生产力，国内大模型还有一定差距。

第一财经：作为AI Agent和作为对话的大模型，它们的主要区别是什么？

董道国：基于大模型的对话应用是给普通人用的，面向C端，利用网页的形式和大模型做一些对话沟通；AI Agent作为一种“大脑”，本质上我们不仅是用它里边的知识，更多地是用它的推理能力去做决策，调用工具和外部知识来完成复杂的任务。

第一财经：国内的大模型未来会成为一个超级 APP 吗？

董道国：会有这样一种趋势。包括一些手机公司做AI终端的目的，就是希望手机继续能够承担所有APP入口。国内包括百度、阿里在发力的大模型，其实也是希望能够承担超级APP的那种角色。

我相信未来随着AI的发展，手机所有APP的形式一定会发生根本性变化。目前APP的形式仍然偏规则式，并不人性化。规则式意味着没有人机对话能力，我们只能根据APP设定的布局来使用，按相应的按键，得到APP的回应，这种模式是反人性的。人最希望直接表达自己的需求而得到满足，而不是点来点去。比如我喊出苹果手机的Siri，让它给我定一个闹钟，它就会直接给我定好。未来随着人工智能的发展，这种功能的适用范围会更广阔，使用起来也会更加便捷。

第一财经：目前各个领域，比如医疗、金融领域都在研发自己的垂域大模型，一些企业也会在一些开源大模型基础之上，结合自己的行业经验和数据积累，推出自己领域的大模型。这给我们一种感觉，大模型的技术门槛是不是没有那么高？

董道国：其实如果有私域的数据，并且数据质量比较高的话，基于现有的一些基座大模型去训练自己的私域大模型，我认为技术上并不是很难。但是训练之后的效果到底怎么样，其实还是要打一个问号，要去看具体的工程方法，训练数据集如何构建需要一定的经验积累。

我一直持有一个观点，当一个企业或者一个行业真的去训练自己的私域大模型的时候，还是需要综合考虑一下，到底是要自己去微调一个大模型，还是用现有大模型去构建一个面向自己行业应用的智能体，要看哪一种方案更符合实际需求。现在很多人其实把RAG（Retrieval Augmented Generation，检索增强生成）和训练私域大模型混淆，我其实更倾向于用RAG 的模式去构建面向某个行业的应用场景。

第一财经：两者的主要区别在哪里？

董道国：微调大模型其实就是在改变大模型的参数，也就是把知识输入到这个大模型里面去。而RAG仅仅用的是大模型的推理能力，而知识源于企业内部自己的数据和知识库。换句话说，第一种模式是把知识灌到大模型里，这有一个缺点：大模型仍然有可能输出它不确定的知识或不清楚的信息，从而造成一些幻觉，导致内容真伪难辨。但是RAG模式通常没使用大模型里的知识，只用了大模型自然语言的理解和推理能力，知识通过检索知识库后送给大模型，让它来根据限定的知识去生成。

第一财经：L0通用大模型和L1垂域大模型，它们目前的商业化进程如何？未来什么样的大模型更容易变现？

董道国：其实如果资金实力比较雄厚的话，那么做L0通用大模型是一件值得去鼓励的事情，但面临应用落地的问题。通用大模型投入很高，变现路径比较长，所以需要持续的资金支持。国家需要这样的L0级大模型出现，所以我觉得这件事情需要由那些有实力的大厂去持续投入。而在一个行业应用里，我认为垂域大模型可能更容易发挥实质性作用。

我倒不建议专门成立一家公司去做垂域大模型，而是应该由已经有明确应用场景的企业，去利用这种通用大模型来优化业务流程，能够马上发挥作用，这种情况更容易成功。如果一个创业团队自己去想象一个行业场景，然后去训练垂类大模型，再销售出去，压力会非常大。所以我一直觉得不应该鼓励过多的创业公司投入到思考应用场景上，应用场景去找技术会比较好。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部：banquan@yicai.com