分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

AI周报|亚马逊再投资Anthropic27.5亿美元；越来越多音乐、游戏从业者面临AI竞争

第一财经 2024-03-31 11:45:43 听新闻

作者：郑栩彤责编：李娜

Suno近日更新的V3版本可生成2分钟音乐，有音乐制作人表达对AI替代音乐人工作的忧虑，称“AI发展成熟后，在音乐制作上会取代90%音乐人”。

亚马逊完成对Anthropic 40亿美元投资

3月28日，亚马逊宣布完成对Anthropic 40亿美元的投资，以深化推进生成式AI技术的发展，这笔投资分两次完成。去年9月，亚马逊进行了12.5亿美元的初始投资，彼时亚马逊曾表示将投资最高40亿美元，获得少数股份。此次亚马逊再投资27.5亿美元，完成了对Anthropic的投资承诺。

根据双方的战略合作协议，Anthropic选择亚马逊云科技（AWS）作为其关键任务工作负载的主要云服务提供商，包括安全性研究及未来基础模型开发。Anthropic将利用Amazon Trainium和Amazon Inferentia芯片来构建、训练和部署未来的模型，并承诺为全球亚马逊云科技客户提供对其未来基础模型在Amazon Bedrock上的长期访问权限。

点评：Anthropic过去一直被视为OpenAI最大的竞争对手之一。就在3月初，Anthropic发布了其最新大模型系列Claude 3，其中最强的Opus在多项基准测试中得分都超过了GPT-4 和Gemini 1.0 Ultra。亚马逊押注初创AI公司，也凸显了大型科技公司对于AI技术的重视。在生成式AI领域，微软已经通过向OpenAI投资130亿美元取得了先发优势，微软还投资了欧洲AI初创公司Mistral，亚马逊与Anthropic的合作，使得其在与微软和谷歌争夺AI领域领导地位的竞争中获得一个有利的AI合作伙伴。

AI音乐生成工具Suno可生成2分钟音乐

Suno近日更新V3版本后引发音乐行业人士关注，这款AI工具可生成2分钟音乐。记者实测发现，Suno生成的音乐十分流畅，人声清晰，可以准确表现摇滚、流行等音乐风格，但目前对其他提示词的理解仍有限。听到Suno AI创作的音乐后，就匠音乐创始人张昭轶对记者评价，“完成度很高，质量也很好。”他认为，那些功能性音乐和快餐类音乐，可以被AI低成本量产。记者从多名音乐从业者了解到，AI音乐工具目前更多是取代简单的音乐创作，但这已能替代一部分编曲工作并改变音乐制作流程。而在专业的游戏音乐制作、学术音乐创作等方面，AI作用还有限。

点评：接受记者采访时，有音乐制作人表达了对Suno替代部分音乐人工作的忧虑，Suno如今展现出来的能力，已能让一些低层次编曲生意没有生存空间，在此基础上，或许未来网红热曲等功能性较强的音乐也会由AI直接生成，有音乐人甚至预计AI会取代90%音乐人。在Suno之外，也有音乐创作者向记者表示，还有MusicLM等其他AI工具。未来哪种AI音乐生成工具能胜出还未成定数，能肯定的是，AI会逐渐渗透进音乐制作。不过，AI虽然降低了音乐创作的门槛，但音乐创作的上限依然很高，这可能是AI很难替代的。

OpenAI公布Sora第一批试用反馈

当地时间3月25日，OpenAI发布博客，展示了多位艺术家使用视频生成模型Sora制作的作品，以及他们对Sora如何融入艺术创作过程和艺术业务的初步想法。自2月推出Sora以来，OpenAI一直在与世界各地的视觉艺术家、设计师、创意总监以及电影制作人合作，了解Sora如何在他们的创作中发挥作用。

通过使用Sora，艺术家们创作了《气球头》《保罗·特里罗》等一系列实验性短片，谈及这次创作体验，《气球头》导演之一伍德曼（Walter Woodman）表示，“Sora在创造看似真实的事物方面表现出色，但更让我们激动的是它创造完全超现实内容的能力。这无疑是抽象表现主义的新纪元。”另一位导演表示，Sora可以做到的，不再是帮助复制旧有的事物，而是将最新的、此前或许从未有机会实现的创意成为现实，这是其最大的魅力。

点评：OpenAI展示了七个实验性视频，让人们见证了OpenAI的视频生成模型Sora在艺术创作领域中的潜力。不过，目前Sora生成视频并未向普通用户开放。OpenAI CTO米拉·穆拉蒂（Mira Murati）在3月13日的一次采访中透露，Sora正在进行红队测试，以确保工具的安全性，并且不会产生偏见或其他有害问题。Mira称将于今年让Sora与广大用户正式见面。

OpenAI展示新音频模型Voice Engine

OpenAI在官网展示了自定义音频模型Voice Engine。用户提供15秒左右参考声音，Voice Engine可生成与原音相似的音频，OpenAI还显示了其他用途，如帮助有言语疾病的人恢复声音。OpenAI在2022年年底就开发了该模型，但出于安全考虑，目前还在小规模测试。

点评：OpenAI在官网上提到合成类似人类声音的安全性问题，并表示，合成语音技术的广泛部署应该伴随着语音身份验证，以验证原始说话者对于自己声音添加到相关服务是否知情。近日AI音频领域频有进展，包括AI音乐合成工具Suno和OpenAI还在小规模测试的Voice Engine，AI的安全性问题值得关注。此前，已有一些AI孙燕姿、AI周杰伦等音乐在网上传播，未来或许每个普通人的声音都可以低成本AI合成且真假难辨，如果不对AI声音合成加以限制，可能会导致AI诈骗等社会问题。

越来越多游戏美术人员需面对AI竞争

近日国内最大的游戏公司腾讯近日拿出了游戏AI引擎GiiNEX，使用大模型等生成式AI技术，提供2D图像、动画、剧情等多种能力。网易CEO丁磊近日则表示："今天AI能做到的事情，比过去十年还要重大。"种种迹象表明，随着AI工具渗透，不论是大游戏公司还是小游戏制作团队，在使用AI提升效率的同时，游戏制作人员都需要适应AI这个潜在竞争对手的存在。盛趣游戏美术总监林蕤告诉第一财经记者，目前拥有自己专用AI工具和大模型的公司团队越来越多。在理想情况下，现在AI已经能帮助完成70%以上游戏美术工作。

点评：AI对游戏美术的渗透早在一年前就开始，那时候对业内的影响还是以替代部分外包美术公司画师为主。但随着AI生图工具迭代，以及AI视频生成Sora面世，更多从业者需要适应AI的存在。

实际上，AI对游戏美术等环节人力的替代，与AI替代程序员完成部分代码是相似的，AI首先能做的还只是一些基础工作，这也意味着，AI如果要对人类从业者进行取代，将是从技术含量低、初级的岗位开始。当AI可以完成基础性工作的时候，人类从业者更应该思考的是，如何发挥人的优势、如何做一些更有创造性的工作。

智元机器人工商变更，投前估值达70亿

近日，智元机器人关联公司上海智元新创技术有限公司发生工商变更，新增股东红杉中国、M31资本、上汽投资，同时注册资本由约6699.4万元人民币增至约6939.1万元人民币，被传新一轮投资。不过，据相关人士表示，该公司最新一轮融资还是去年12月，此次新增的股东实际上是上一次融资时候的投资人，但工商变更有相应的审核流程，因此导致了滞后性。

自2023年2月成立以来，智元机器人已拿下5轮融资，背后资方包括高瓴创投、奇绩创坛、高榕资本、经纬创投、BV百度风投、比亚迪、上汽投资等明星产业资本和财务投资机构。最新一轮投资时，有消息流出，智元机器人投前估值达70亿元。

点评：智元机器人堪称VC圈最火爆项目之一，公司背后，其创始人是曾经的华为天才少年、B站Up主——稚晖君彭志辉，其搭档是上海交大教授闫维新。智元机器人于去年8月推出远征A1智元具身智能机器人，团队曾透露，远征A1的商业化将首先应用于工业智造领域，他们在和汽车公司、3C制造商接触。在大模型的带动下，拥有智能本体的人形机器人被认为是下一个具有想象力的赛道。

AI视频生成公司HeyGen募集新一轮融资：估值4.4亿美元

据媒体援引知情人士消息，数字人视频生成初创公司HeyGen正在募集6000万美元的最新一轮融资，领投方为Benchmark，Benchmark 也是Snap 和 Uber 的早期投资者之一。据报道，HeyGen目前正在按照投资前估值4.4亿美元进行融资，市场测算较4个月前的估值水平增长了6倍。

HeyGen 是一款 AI 数字人产品，去年10月，一系列郭德纲流利飚英文相声、让泰勒·斯威夫特说地道中文的视频在全网传播，其背后的公司HeyGen也随之爆红，成为AI视频领域的明星初创公司。HeyGen原名Surreal诗云科技，由前Snap软件工程师Joshua Xu以及前字节产品设计师Wayne Liang于2020年底创立，总部位于洛杉矶，早期中国投资者包括红杉中国以及真格基金。

点评：HeyGen试图瞄准市场营销人员和销售人员等B端商业客户，将自己与Pika Labs和Genmo等竞争对手区分开来。公司曾在博客中透露，产品上线后178天，公司的年度经常性收入就达到了100万美元，上线7个月就已达到盈利状态。AIGC的出现无疑给数字人领域的创企带来了新的故事。

AI芯片公司地平线冲刺IPO

上市传闻已久，地平线终于在3月26日向港交所递交招股书。招股书显示，地平线过去三年收入增长的同时，研发开支也在增长，年经调整亏损净额超10亿元。从2021年到2023年，地平线研发支出分别达到11.44亿元、18.8亿元、23.66亿元，分别等于对应年份收入的245%、207.6%和152.5%。从合并损益表看，地平线过去三年收入、毛利维持增长，毛利率也维持在70%左右的较高水平，但收入规模还不够大的情况下，研发支出高昂成为其亏损的一大原因。

点评：地平线是国内主要智驾芯片公司之一。据盖世汽车研究院数据，去年智驾域控芯片装机量排行前十名中，地平线旗下两款芯片市占率共8.2%，国内厂商爱芯元智凌芯01市占3.8%，华为昇腾610市占1.9%，而特斯拉FSD装机量份额37%，英伟达Drive Orin-X市占率33.5%。可以看出外资智驾厂商仍旧强势，国内厂商要在巨头环伺的市场中存活并扩大市场份额并不容易。

在智能驾驶发展早期，地平线等厂商不可避免要投入高昂的研发费用、参与技术竞赛。而从市场策略上，扩大用户群则是扩大销售规模的一条路径。地平线已计划在今年4月推出征程6系列，与以往的系列不同，新系列将同时涵盖旗舰版和中低阶产品。地平线能否同时把握住不同细分市场的客户，接下来拭目以待。

商汤发布财报，2023年生成式AI业务营收增两倍

3月26日晚，人工智能软件公司商汤科技发布2023年全年业绩，实现全年营收34亿元，同比减少11%，主要原因是集团主动收缩了智慧城市业务。另外商汤年度亏损64.94亿元，2022年同期为亏损60.45亿元。值得注意的是，2023年，商汤生成式AI业务实现了同比200%的增长，占总收入比例超过35％。

商汤科技董事长兼CEO徐立在业绩发布会上表示，2023年，集团明确了新的三大业务板块：生成式AI、传统AI和智能汽车；以生成式AI业务为重点发展方向，同时保持传统AI业务和智能汽车的优势。“集团生成式AI业务收入达12亿人民币，这是商汤成立十年以来，以最快速度从无到有、超过10亿收入体量的新业务。”

点评：对于AI企业来说，近一年多以来，生成式AI的出现无疑为其未来再添新的想象力。此次业绩会上，徐立表示生成式AI对商汤来说已不仅仅是技术领域的变革性创新，更成为公司的核心业务。商汤生成式AI业务的增长，得益于各行各业对大模型的训练和推理的广泛需求，这预示着中国硬科技投资的新周期正式开启。徐立透露，公司预计4月份发布“日日新5.0”版本，性能全面对标GPT4-Turbo。

大参数大语言模型DBRX开源

大数据人工智能公司Databricks开源了通用大模型DBRX，这是一款1320亿参数的混合专家模型（MoE）。该模型在英伟达GDX Cloud上训练，在语言理解（MMLU）、编程（HumanEval）和数学（GSM8K）基准上表现优于LLaMa2-70B、Grok-1等开源大模型，在语言理解、编程和数学方面优于GPT-3.5。Databrick在AI领域多有布局，此前公司收购了AI初创公司MosaicML，还有消息称，Databricks公司去年第四季度的客户交易数据创下历史纪录，这与公司业务更多使用生成式AI有关。

点评：3月18日，马斯克大模型公司xAI刚刚宣布开源3140亿参数大模型Grok-1，同日国内创业企业潞晨科技Colossal-AI团队全面开源Open Sora模型，本周又有参数量上千的大语言模型开源。开源在大语言模型竞争中越发成为不可忽视的力量。相对闭源商用的大模型，企业可在开源大模型的基础上进行预训练或微调，且可以部署在自己的服务器上，安全性可更有保障，此外，客观而言，大语言模型开源还能为AI公司“打广告”，吸引客户购买自己参数量更大的大模型服务。开源和闭源两股力量未来还有望继续博弈，给用户提供更多样的选择。

谷歌Gemini Nano模型将登陆Pixel 8

3月28日，谷歌宣布Pixel 8将在下一个Pixel功能中支持Gemini Nano，这将是一个开发者预览版，这个模型将为两个扩展功能提供动力，包括在录音机应用中的摘要总结功能，以及在Gboard（虚拟键盘）应用中的智能回复功能。Pixel 8是去年谷歌推出的智能手机，Gemini Nano则是去年底谷歌发布的Gemini AI模型的轻量级版本。在此之前，谷歌已宣布其高端智能手机Pixel 8 Pro将搭载Gemini Nano。

点评：不久前，有消息称苹果正与谷歌洽谈，关于在iPhone中使用谷歌Gemini AI引擎，苹果还有传言将与百度文心一言在下一代iPhone中合作，但百度方面暂无回应。近日，手机芯片厂商联发科则已在天玑9300等旗舰芯片上部署通义千问18亿、40亿参数大模型，实现大模型在手机芯片端深度适配，以实现端侧AI。

不难看出，不论是芯片厂商、大语言模型厂商还是手机厂商，在AI手机竞赛中都在加速跑。如果能抓住AI手机风口，利润或将是丰厚的。此前三星首款AI手机Galaxy S24在韩国开售28天就突破100万部销量，刷新S系列手机销量突破100万的最快纪录，这便是一个很好的案例。

IDC：中国生成式AI投资五年复合增长率达86.2%

近日，知名行研机构IDC发布了2024年V1版IDC《全球人工智能和生成式人工智能支出指南》。IDC数据显示，2022年AI IT总投资规模为1324.9亿美元，并有望在2027年增至5124.2亿美元，年复合增长率（CAGR）为31.1%。聚焦生成式AI，IDC调查发现，到2027年45%的企业将掌握并使用生成式AI来共同开发数字产品和服务，从而使收入增长比竞争对手翻一番。IDC预测，全球生成式AI市场年复合增长率或达85.7%，到2027年全球生成式AI市场规模将接近1500亿美元。

中国生成式AI市场洞察方面，IDC数据显示，2022年生成式AI占AI市场投资总规模的4.6%。随着生成式AI技术的快速发展，2027年生成式AI投资占比将达到33.0%，投资规模超130亿美元，五年复合增长率（CAGR）为86.2%。

点评：据IDC的观点，生成式AI将成为向自动化迈进的关键技术，在通用生产力、业务特定功能或行业特定任务方面都能产生影响。例如，企业员工可以使用生成式AI来总结报告、生成职位描述、优化工作任务或获取有关某一主题的知识。软件开发者可以利用生成式AI工具丰富和加速与开发相关的工作流程并改变开发体验。IDC数据显示，软件和信息服务、银行与通讯行业是人工智能投资最多的三个行业，2027年占比分别为23.8%、9.7%与9.4%。

第一财经广告合作，请点击这里

此内容为第一财经原创，著作权归第一财经所有。未经第一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部：021-22002972或021-22002335；banquan@yicai.com。