首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

AI周报|亚马逊再投资Anthropic27.5亿美元;越来越多音乐、游戏从业者面临AI竞争

第一财经 2024-03-31 11:45:43 听新闻

作者:郑栩彤    责编:李娜

Suno近日更新的V3版本可生成2分钟音乐,有音乐制作人表达对AI替代音乐人工作的忧虑,称“AI发展成熟后,在音乐制作上会取代90%音乐人”。

亚马逊完成对Anthropic 40亿美元投资

3月28日,亚马逊宣布完成对Anthropic 40亿美元的投资,以深化推进生成式AI技术的发展,这笔投资分两次完成。去年9月,亚马逊进行了12.5亿美元的初始投资,彼时亚马逊曾表示将投资最高40亿美元,获得少数股份。此次亚马逊再投资27.5亿美元,完成了对Anthropic的投资承诺。

根据双方的战略合作协议 ,Anthropic选择亚马逊云科技(AWS)作为其关键任务工作负载的主要云服务提供商,包括安全性研究及未来基础模型开发。Anthropic将利用Amazon Trainium和Amazon Inferentia芯片来构建、训练和部署未来的模型,并承诺为全球亚马逊云科技客户提供对其未来基础模型在Amazon Bedrock上的长期访问权限。

点评:Anthropic过去一直被视为OpenAI最大的竞争对手之一。就在3月初,Anthropic发布了其最新大模型系列Claude 3,其中最强的Opus在多项基准测试中得分都超过了GPT-4 和Gemini 1.0 Ultra。亚马逊押注初创AI公司,也凸显了大型科技公司对于AI技术的重视。在生成式AI领域,微软已经通过向OpenAI投资130亿美元取得了先发优势,微软还投资了欧洲AI初创公司Mistral,亚马逊与Anthropic的合作,使得其在与微软和谷歌争夺AI领域领导地位的竞争中获得一个有利的AI合作伙伴。

AI音乐生成工具Suno可生成2分钟音乐

Suno近日更新V3版本后引发音乐行业人士关注,这款AI工具可生成2分钟音乐。记者实测发现,Suno生成的音乐十分流畅,人声清晰,可以准确表现摇滚、流行等音乐风格,但目前对其他提示词的理解仍有限。听到Suno AI创作的音乐后,就匠音乐创始人张昭轶对记者评价,“完成度很高,质量也很好。”他认为,那些功能性音乐和快餐类音乐,可以被AI低成本量产。记者从多名音乐从业者了解到,AI音乐工具目前更多是取代简单的音乐创作,但这已能替代一部分编曲工作并改变音乐制作流程。而在专业的游戏音乐制作、学术音乐创作等方面,AI作用还有限。

点评:接受记者采访时,有音乐制作人表达了对Suno替代部分音乐人工作的忧虑,Suno如今展现出来的能力,已能让一些低层次编曲生意没有生存空间,在此基础上,或许未来网红热曲等功能性较强的音乐也会由AI直接生成,有音乐人甚至预计AI会取代90%音乐人。在Suno之外,也有音乐创作者向记者表示,还有MusicLM等其他AI工具。未来哪种AI音乐生成工具能胜出还未成定数,能肯定的是,AI会逐渐渗透进音乐制作。不过,AI虽然降低了音乐创作的门槛,但音乐创作的上限依然很高,这可能是AI很难替代的。

OpenAI公布Sora第一批试用反馈

当地时间3月25日,OpenAI发布博客,展示了多位艺术家使用视频生成模型Sora制作的作品,以及他们对Sora如何融入艺术创作过程和艺术业务的初步想法。自2月推出Sora以来,OpenAI一直在与世界各地的视觉艺术家、设计师、创意总监以及电影制作人合作,了解Sora如何在他们的创作中发挥作用。

通过使用Sora,艺术家们创作了《气球头》《保罗·特里罗》等一系列实验性短片,谈及这次创作体验,《气球头》导演之一伍德曼(Walter Woodman)表示,“Sora在创造看似真实的事物方面表现出色,但更让我们激动的是它创造完全超现实内容的能力。这无疑是抽象表现主义的新纪元。”另一位导演表示,Sora可以做到的,不再是帮助复制旧有的事物,而是将最新的、此前或许从未有机会实现的创意成为现实,这是其最大的魅力。

点评:OpenAI展示了七个实验性视频,让人们见证了OpenAI的视频生成模型Sora在艺术创作领域中的潜力。不过,目前Sora生成视频并未向普通用户开放。OpenAI CTO米拉·穆拉蒂(Mira Murati)在3月13日的一次采访中透露,Sora正在进行红队测试,以确保工具的安全性,并且不会产生偏见或其他有害问题。Mira称将于今年让Sora与广大用户正式见面。

OpenAI展示新音频模型Voice Engine

OpenAI在官网展示了自定义音频模型Voice Engine。用户提供15秒左右参考声音,Voice Engine可生成与原音相似的音频,OpenAI还显示了其他用途,如帮助有言语疾病的人恢复声音。OpenAI在2022年年底就开发了该模型,但出于安全考虑,目前还在小规模测试。

点评:OpenAI在官网上提到合成类似人类声音的安全性问题,并表示,合成语音技术的广泛部署应该伴随着语音身份验证,以验证原始说话者对于自己声音添加到相关服务是否知情。近日AI音频领域频有进展,包括AI音乐合成工具Suno和OpenAI还在小规模测试的Voice Engine,AI的安全性问题值得关注。此前,已有一些AI孙燕姿、AI周杰伦等音乐在网上传播,未来或许每个普通人的声音都可以低成本AI合成且真假难辨,如果不对AI声音合成加以限制,可能会导致AI诈骗等社会问题。

越来越多游戏美术人员需面对AI竞争

近日国内最大的游戏公司腾讯近日拿出了游戏AI引擎GiiNEX,使用大模型等生成式AI技术,提供2D图像、动画、剧情等多种能力。网易CEO丁磊近日则表示:"今天AI能做到的事情,比过去十年还要重大。"种种迹象表明,随着AI工具渗透,不论是大游戏公司还是小游戏制作团队,在使用AI提升效率的同时,游戏制作人员都需要适应AI这个潜在竞争对手的存在。盛趣游戏美术总监林蕤告诉第一财经记者,目前拥有自己专用AI工具和大模型的公司团队越来越多。在理想情况下,现在AI已经能帮助完成70%以上游戏美术工作。

点评:AI对游戏美术的渗透早在一年前就开始,那时候对业内的影响还是以替代部分外包美术公司画师为主。但随着AI生图工具迭代,以及AI视频生成Sora面世,更多从业者需要适应AI的存在。

实际上,AI对游戏美术等环节人力的替代,与AI替代程序员完成部分代码是相似的,AI首先能做的还只是一些基础工作,这也意味着,AI如果要对人类从业者进行取代,将是从技术含量低、初级的岗位开始。当AI可以完成基础性工作的时候,人类从业者更应该思考的是,如何发挥人的优势、如何做一些更有创造性的工作。

智元机器人工商变更,投前估值达70亿

近日,智元机器人关联公司上海智元新创技术有限公司发生工商变更,新增股东红杉中国、M31资本、上汽投资,同时注册资本由约6699.4万元人民币增至约6939.1万元人民币,被传新一轮投资。不过,据相关人士表示,该公司最新一轮融资还是去年12月,此次新增的股东实际上是上一次融资时候的投资人,但工商变更有相应的审核流程,因此导致了滞后性。

自2023年2月成立以来,智元机器人已拿下5轮融资,背后资方包括高瓴创投、奇绩创坛、高榕资本、经纬创投、BV百度风投、比亚迪、上汽投资等明星产业资本和财务投资机构。最新一轮投资时,有消息流出,智元机器人投前估值达70亿元。

点评:智元机器人堪称VC圈最火爆项目之一,公司背后,其创始人是曾经的华为天才少年、B站Up主——稚晖君彭志辉,其搭档是上海交大教授闫维新。智元机器人于去年8月推出远征A1智元具身智能机器人,团队曾透露,远征A1的商业化将首先应用于工业智造领域,他们在和汽车公司、3C制造商接触。在大模型的带动下,拥有智能本体的人形机器人被认为是下一个具有想象力的赛道。

AI视频生成公司HeyGen募集新一轮融资:估值4.4亿美元

据媒体援引知情人士消息,数字人视频生成初创公司HeyGen正在募集6000万美元的最新一轮融资,领投方为Benchmark,Benchmark 也是Snap 和 Uber 的早期投资者之一。据报道,HeyGen目前正在按照投资前估值4.4亿美元进行融资,市场测算较4个月前的估值水平增长了6倍。

HeyGen 是一款 AI 数字人产品,去年10月,一系列郭德纲流利飚英文相声、让泰勒·斯威夫特说地道中文的视频在全网传播,其背后的公司HeyGen也随之爆红,成为AI视频领域的明星初创公司。HeyGen原名Surreal诗云科技,由前Snap软件工程师Joshua Xu以及前字节产品设计师Wayne Liang于2020年底创立,总部位于洛杉矶,早期中国投资者包括红杉中国以及真格基金。

点评:HeyGen试图瞄准市场营销人员和销售人员等B端商业客户,将自己与Pika Labs和Genmo等竞争对手区分开来。公司曾在博客中透露,产品上线后178天,公司的年度经常性收入就达到了100万美元,上线7个月就已达到盈利状态。AIGC的出现无疑给数字人领域的创企带来了新的故事。

AI芯片公司地平线冲刺IPO

上市传闻已久,地平线终于在3月26日向港交所递交招股书。招股书显示,地平线过去三年收入增长的同时,研发开支也在增长,年经调整亏损净额超10亿元。从2021年到2023年,地平线研发支出分别达到11.44亿元、18.8亿元、23.66亿元,分别等于对应年份收入的245%、207.6%和152.5%。从合并损益表看,地平线过去三年收入、毛利维持增长,毛利率也维持在70%左右的较高水平,但收入规模还不够大的情况下,研发支出高昂成为其亏损的一大原因。

点评:地平线是国内主要智驾芯片公司之一。据盖世汽车研究院数据,去年智驾域控芯片装机量排行前十名中,地平线旗下两款芯片市占率共8.2%,国内厂商爱芯元智凌芯01市占3.8%,华为昇腾610市占1.9%,而特斯拉FSD装机量份额37%,英伟达Drive Orin-X市占率33.5%。可以看出外资智驾厂商仍旧强势,国内厂商要在巨头环伺的市场中存活并扩大市场份额并不容易。

在智能驾驶发展早期,地平线等厂商不可避免要投入高昂的研发费用、参与技术竞赛。而从市场策略上,扩大用户群则是扩大销售规模的一条路径。地平线已计划在今年4月推出征程6系列,与以往的系列不同,新系列将同时涵盖旗舰版和中低阶产品。地平线能否同时把握住不同细分市场的客户,接下来拭目以待。

商汤发布财报,2023年生成式AI业务营收增两倍

3月26日晚,人工智能软件公司商汤科技发布2023年全年业绩,实现全年营收34亿元,同比减少11%,主要原因是集团主动收缩了智慧城市业务。另外商汤年度亏损64.94亿元,2022年同期为亏损60.45亿元。值得注意的是,2023年,商汤生成式AI业务实现了同比200%的增长,占总收入比例超过35%。

商汤科技董事长兼CEO徐立在业绩发布会上表示,2023年,集团明确了新的三大业务板块:生成式AI、传统AI和智能汽车;以生成式AI业务为重点发展方向,同时保持传统AI业务和智能汽车的优势。“集团生成式AI业务收入达12亿人民币,这是商汤成立十年以来,以最快速度从无到有、超过10亿收入体量的新业务。”

点评:对于AI企业来说,近一年多以来,生成式AI的出现无疑为其未来再添新的想象力。此次业绩会上,徐立表示生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求,这预示着中国硬科技投资的新周期正式开启。徐立透露,公司预计4月份发布“日日新5.0”版本,性能全面对标GPT4-Turbo。

大参数大语言模型DBRX开源

大数据人工智能公司Databricks开源了通用大模型DBRX,这是一款1320亿参数的混合专家模型(MoE)。该模型在英伟达GDX Cloud上训练,在语言理解(MMLU)、编程(HumanEval)和数学(GSM8K)基准上表现优于LLaMa2-70B、Grok-1等开源大模型,在语言理解、编程和数学方面优于GPT-3.5。Databrick在AI领域多有布局,此前公司收购了AI初创公司MosaicML,还有消息称,Databricks公司去年第四季度的客户交易数据创下历史纪录,这与公司业务更多使用生成式AI有关。

点评:3月18日,马斯克大模型公司xAI刚刚宣布开源3140亿参数大模型Grok-1,同日国内创业企业潞晨科技Colossal-AI团队全面开源Open Sora模型,本周又有数量上千的大语言模型开源。开源在大语言模型竞争中越发成为不可忽视的力量。相对闭源商用的大模型,企业可在开源大模型的基础上进行预训练或微调,且可以部署在自己的服务器上,安全性可更有保障,此外,客观而言,大语言模型开源还能为AI公司“打广告”,吸引客户购买自己参数量更大的大模型服务。开源和闭源两股力量未来还有望继续博弈,给用户提供更多样的选择。

谷歌Gemini Nano模型将登陆Pixel 8

3月28日,谷歌宣布Pixel 8将在下一个Pixel功能中支持Gemini Nano,这将是一个开发者预览版,这个模型将为两个扩展功能提供动力,包括在录音机应用中的摘要总结功能,以及在Gboard(虚拟键盘)应用中的智能回复功能。Pixel 8是去年谷歌推出的智能手机,Gemini Nano则是去年底谷歌发布的Gemini AI模型的轻量级版本。在此之前,谷歌已宣布其高端智能手机Pixel 8 Pro将搭载Gemini Nano。

点评:不久前,有消息称苹果正与谷歌洽谈,关于在iPhone中使用谷歌Gemini AI引擎,苹果还有传言将与百度文心一言在下一代iPhone中合作,但百度方面暂无回应。近日,手机芯片厂商联发科则已在天玑9300等旗舰芯片上部署通义千问18亿、40亿参数大模型,实现大模型在手机芯片端深度适配,以实现端侧AI。

不难看出,不论是芯片厂商、大语言模型厂商还是手机厂商,在AI手机竞赛中都在加速跑。如果能抓住AI手机风口,利润或将是丰厚的。此前三星首款AI手机Galaxy S24在韩国开售28天就突破100万部销量,刷新S系列手机销量突破100万的最快纪录,这便是一个很好的案例。

IDC:中国生成式AI投资五年复合增长率达86.2%

近日,知名行研机构IDC发布了2024年V1版IDC《全球人工智能和生成式人工智能支出指南》。IDC数据显示,2022年AI IT总投资规模为1324.9亿美元,并有望在2027年增至5124.2亿美元,年复合增长率(CAGR)为31.1%。聚焦生成式AI,IDC调查发现,到2027年45%的企业将掌握并使用生成式AI来共同开发数字产品和服务,从而使收入增长比竞争对手翻一番。IDC预测,全球生成式AI市场年复合增长率或达85.7%,到2027年全球生成式AI市场规模将接近1500亿美元。

中国生成式AI市场洞察方面,IDC数据显示,2022年生成式AI占AI市场投资总规模的4.6%。随着生成式AI技术的快速发展,2027年生成式AI投资占比将达到33.0%,投资规模超130亿美元,五年复合增长率(CAGR)为86.2%。

点评:据IDC的观点,生成式AI将成为向自动化迈进的关键技术,在通用生产力、业务特定功能或行业特定任务方面都能产生影响。例如,企业员工可以使用生成式AI来总结报告、生成职位描述、优化工作任务或获取有关某一主题的知识。软件开发者可以利用生成式AI工具丰富和加速与开发相关的工作流程并改变开发体验。IDC数据显示,软件和信息服务、银行与通讯行业是人工智能投资最多的三个行业,2027年占比分别为23.8%、9.7%与9.4%。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭