大模型正在引领新一轮工业革命,如何获取大量行业数据训练大模型,将行业knowhow封装进大模型,从而实现B端应用落地与商业变现,是目前行业大模型厂商普遍面临的痛难点。
11月5日,香港中文大学终身教授、思谋科技创始人兼董事长贾佳亚在第六届中国国际进口博览会暨虹桥国际经济论坛开幕式携团队正式发布工业多模态大模型IndustryGPT V1.0。
贾佳亚表示,IndustryGPT打破了传统人机交互的界限,为用户提供了更加直观、便捷的使用体验。无论是工程师、生产管理者,还是产线工作人员,均可轻松上手、“开箱即用”。
目前,AI大模型的应用尚处早期阶段,B端市场的碎片化程度非常高,各行各业、各种各样的数据需要进行的预处理和再加工能力“非常难以统一化”,工业场景数据更是复杂多样。
同时,由于涉及到数据采集、知识梳理以及知识提取,行业数据的获取是一个比较大的挑战。目前行业数据采集还未形成产业,现在还在获取数据的过程中。目前各家行业大模型厂商在行业数据获取方面须得“各显神通”。
据悉,思谋科技为研发工业大模型收集整理了市面上包括光、机、 电、算、软五大学科,电子、装备、钢铁、采矿、电力、石化、建筑、纺织等八大行业的全面知识,以及多年研发、生产服务积累的独特数据,共涵盖超200个不同的工业场景,超300万张工业图像,超500亿Tokens。在此基础上,思谋科技对数据进行精炼,并邀请超100位工程专家,对批次数据质量进行抽样评估,并进行“文本对”数据编写。
思谋科技称,公司核心团队拥有20多年的人工智能技术研发经历,专注智能制造,目前已服务全球各行业头部企业超200家,积累了完备的制造业智能化升级的知识与经验,以及不同场景的工业数据,为工业大模型的开发奠定了技术与行业基础。
贾佳亚透露,“IndustryGPT将基于V1.0版本上持续开发,并走向真正的智能体。”
《指南》旨在促进中外资金融机构金融业数据跨境流动更加高效、规范,进一步明确数据出境的具体情形以及可跨境流动的数据项清单,便利数据跨境流动。
“买菜无需豪华车”,大模型落地前厂商需要考虑成本和性能的平衡。
OpenAI创始人Sam Altman:将在几周内发布o3、o4-MINI;谷歌宣布一个新的实验性人工智能模型Sec-Gemini V1。
国家数据局正会同国务院国资委制定国有企业数据效能提升行动的实施方案,推动国有企业数据管理机制创新。
“应用为王”这一理念在大模型技术发展与落地中尤为重要,已经成为产业界、企业界最迫切解决的一个课题。