合合信息创始人、CEO镇立新最近正忙着为世界人工智能大会的“未来金融”分论坛做准备。
“在这一论坛上,我们将邀请诺贝尔经济学奖获得者、经济领域理性预期学派的领袖人物托马斯·萨金特(Thomas J.Sargent),著名机器学习专家、《终极算法》作者佩德罗·多米尼戈(PedroDoMIngos),苹果机器学习和人工智能战略高级副总裁约翰·詹南德拉(JohnGiannandrea)等,全球行业领袖一起探讨最热门的人工智能+金融话题,包括监管、技术驱动、人工智能创新、数字金融和电子支付。我也将出席未来金融分论坛做主题发言。”他一口气回复了第一财经这么些内容,足以看出对这场盛会和大咖嘉宾们到来的期待。
合合信息创立伊始就致力于服务商务人群,人工智能是产品和企业服务的支持技术。在产品上有名片全能王、扫描全能王、启信宝;在企业服务上主要是to B端,提供商业链接相关的服务。合合信息在C端拥有几亿下载用户,在B端也拥有数千家企业客户。
作为一家人工智能公司,镇立新重点关注的是AI技术在商业和商务领域中的新场景。可以看到,二维码技术和4G的结合推动移动支付的发展,成为了现金支付的新补充,诞生了支付宝、微信支付的巨头;区块链的出现改变了数据储存和交换的方式,基于此开发的Libra正被全世界的中央银行所关注,人工智能技术的发展也意味着影响到人们生活的新模式正在孕育之中。
“上半年公司业务发展很快,签约了很多企业大客户,合合信息的产品与后台技术已经运用到30多个重点行业。在技术领域,2019上半年,在全球顶级AI竞赛——ICDAR文档分析与识别竞赛上,合合信息参赛摘得表格检测任务的冠军,同时,联合高校共同获得票据文字检测任务的冠军。这些都是让我比较满意的表现。” 镇立新说。
如大多数的人工智能公司一样,在具体技术落地的过程中,经同样历了厚积薄发。在智能识别领域,合合信息支持全球65种文字识别和语义理解,以银行卡识别为例,不同国家的银行卡上的文字样式非常复杂,背景更是五彩斑斓。想“教”会机器识别这种背景下的各种凹凸字体可不容易,且不说同一种文字不同字体也会有不同的识别难度,还要考虑拍摄环境干扰、光线、材质、透明度、噪点,都会成为影响因素。虽然挑战重重,镇立新已经可以自信地表示在银行卡识别领域准确度达到99.9%。
从最早的单纯光学扫描识别(OCR)到场景文字识别(STR)、图像处理、深度学习算法,合合信息拥有名片、财报、企业三证、表格、合同、外卖小票等多种不同的识别模块,通过大量数据积累沉淀分析以及计算机神经网络的深度学习,合合信息对文字语义理解大幅提升。
在Valse 2019学术研讨会上,合合信息对外展示了四款机器人产品:智能票据机器人、财报机器人、合同文本配置机器人、表格配置机器人。合合信息“STR+ Data + AI ” 解决方案旨在替代简单重复的脑力劳动,改善流程效率。
镇立新认为,AI的范围非常广泛,可以和各行各业结合出不同的新形态。他表示,合合信息已支持100多项识别模块,30多种证件自动分类,整合了近600亿条动态商业数据库、1.8亿家国内企业与工商个体数据、2.2亿多家全球企业数据,通过700多个维度透视企业动态信息,可以实现数据自动分类、标注、录入、分析,将其转化成机器可训练的结构数据。“根据场景需求对模型、策略、算法选择最适合的机器学习方案,可以深度赋能银行、保险、证券、物流等行业AI能力。”
当然,人工智能企业的发展并不会一帆风顺。对此,镇立新有着清醒的认识。“2019年很多人认为是经济寒冬,是人工智能领域的寒冬。像这样的经济周期是难免的,就好像每个人的人生也是有周期的,我们必须去面对。每次经济低谷都有可能是技术创新和产品创新的黄金时段。经历过低谷的洗礼,真正的人工智能公司也将成长。” 镇立新说。
会上明确,探索建设国家级数据标注基地,充分发挥地方配套支撑作用,在数据标注产业的生态构建、能力提升和场景应用等方面先行先试,集聚龙头企业,促进区域人工智能产业生态发展。
今年将开展“人工智能+”行动,促进人工智能与实体经济深度融合,推动人工智能赋能新型工业化。
Zack Kass接着表示:“人是什么,机器是什么,我们要分清事实,要分清界限。未来的生活中我愿意和人互动,而不是和机器互动,不是做很多实验、做很多研究,人与人交互非常重要。”
决议承认“人工智能系统的治理是一个不断发展的领域”,需要进一步讨论可能的治理方法。
去年,人工智能生成式语言模型ChatGPT问世,今年视频生成模型Sora出现,这些新技术对人工智能的认识产生了新的影响,推动了大模型、智能芯片等关键环节的突破。