今日,多模态AI板块走高,汤姆猫、声讯股份涨停,真视通、盛天网络、金财互联等纷纷跟涨;资金方面,汤姆猫获主力净流入超10亿元,声讯股份超1亿元。
消息面上,北京时间5月14日凌晨,OpenAI举办了线上“春季更新”活动,发布最新多模态大模型“GPT-4o”,支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。据介绍,GPT-4o的速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。同时,OpenAI推出有使用限额的ChatGPT Free,新闻稿称,即使是ChatGPT Free(免费)用户也可以有机会体验GPT-4o,但当达到限额时,ChatGPT将自动切换到GPT-3.5。
光大证券研报表示,GPT-4o性能提升,API调用成本显著下降。当前GPT-4o API调用存在一定的限制,GPT-4o多模态模型显著降低延迟。GPT-4o展现出的低成本、低延迟特性将对整个行业产生连锁效应,这将体现在1)推理端降本有望大幅提振应用端需求;2)AI商业化竞争由模型端扩散至基础设施架构。投资建议方面,高性能模型免费开放,推理端降本速度超预期,使更多AI应用在商业上可行;具备多模态能力和情感处理能力的AI语音助手有望融入AR/VR、教育、情感陪伴等场景。
华鑫证券研报分析,从国产搜索产品Kimi及秘塔,到当下GPT-4o的推出,国产化类产品后续的推出也有望重燃市场热度。从投资维度看,传媒应用迎AI推力,可关注AI+陪伴、AI+运动体育教育及运动处方、AI+MR+文化科普虚实体验、AI+文娱、AI+营销及电商、AI+内容。
浙商证券研报认为,以GPT-4o为代表,国内外大模型有望在未来一段时间实现模型性能以及用户交互体验方面的双重迭代,随着模型输出质量、响应时间等维度的不断优化AI应用有望真正实现用户体验和效率提升的赋能,AI有望在各细分行业中持续加速商业化落地,并成为用户的智能助理。
小米首款AI眼镜发布,支持第三方APP视频通话、直播;谷歌推出开源AI编程工具Gemini CLI;Anthropic宣布Claude新增AI应用构建功能。
万兴天幕音视频多媒体大模型2.0发布;苹果公司就收购Perplexity AI事宜进行了内部讨论;英国AI初创公司PhysicsX估值据悉接近10亿美元。
①聚焦AI技术滥用,中央网信办处置账号3700余个;②苹果讨论收购人工智能初创公司Perplexity AI;③谷歌用YouTube视频训练AI模型。
第一阶段累计处置违规小程序、应用程序、智能体等AI产品3500余款,清理违法违规信息96万余条,处置账号3700余个,各项工作取得积极进展。
字节跳动Seed团队与比亚迪锂电池将共建“AI+高通量联合实验室”;阿里云在欧洲上线多款AI产品;谷歌推出轻量级模型Gemini 2.5 Flash-Lite。