分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

腾讯混元支持元宝上新多模态理解能力

第一财经 2025-02-21 19:17:15

责编：江雪

腾讯混元支持元宝上新多模态理解能力

腾讯混元支持元宝上新多模态理解能力，通过跨模态协同的架构设计，实现深度思考模型对图片的理解与推理。相比传统OCR识别仅提取图像中的文字内容，缺乏语义关联。混元多模态理解模型能够融合视觉、文本、布局等多模态信息，理解图像中各元素之间的关系，对图片含义有更深层次的解析，为语言模型执行推理任务提供更丰富的信息基础。