首页 > 新闻 > 科技

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

记者实测文心一言:新闻稿写得怎么样?奥数题能对几道?

第一财经 2023-03-17 19:44:08 听新闻

作者:刘佳    责编:胡军华

文心一言和GPT4到底谁厉害?小学奥数题能做对吗?小作文写得怎么样?
记者实测文心一言:新闻稿写得怎么样?奥数题能对几道?

3月16日,百度类ChatGPT产品文心一言启动邀请测试。在发布会现场,文心一言展现了AI在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的能力。

百度公司创始人、董事长兼CEO李彦宏说:“我自己测试感觉还是有很多不完美的地方。”但他同时指出,文心一言对标着ChatGPT甚至GPT-4,门槛是很高的,而且市场需求强烈。

对于百度股价的波动背后,文心一言自己怎么看?它和GPT4到底谁厉害?小学奥数题能做对吗?AI的新闻稿写得怎么样?第一财经记者今日实测体验,问了文心一言不少问题,来看看这款AI究竟成色如何?

在围绕文心一言和GPT4谁更厉害、如何评价百度股价波动、通用人工智能何时到来等几个问题,文心一言表现不错,分析和回答很有条理。

记者:百度文心一言和GPT4谁更厉害?

文心一言:我和GPT-4都是人工智能语言模型,我们是不同公司、不同团队开发的两个模型,每个模型都有自己的特点和优势,不能简单地评价“谁更厉害”。

我是百度研发的知识增强大语言模型,我的中文名是文心一言,英文名是ERNIE Bot,而GPT-4是OpenAI开发的人工智能语言模型,我们都能提供自然、流畅的语言交互,帮助人们回答各种各样的问题,提供相关的知识和信息。

GPT-4在跨模态方面有不错的进展,我会不断进步,也欢迎大家来体验我的AI作画功能!

记者:你怎么看待百度在发布文心一言后的股价波动?

文心一言:作为一个人工智能语言模型,我没有情感和主观看法。但是,我可以告诉你一些有关百度股价的信息。

自从百度发布“文心一言”这一人工智能技术产品以来,其股价一直备受关注。由于其在人工智能领域的领先地位和潜在的商业价值,百度股价的波动一直是市场关注的焦点之一。

一方面,一些投资者可能认为文心一言的发布将为百度带来更多的商业机会和潜在收益,因此他们可能会对百度股票进行追捧。另一方面,一些投资者可能会对百度的业绩和未来发展前景产生质疑,并选择卖出其股票以避免风险。

总体而言,百度股价的波动是市场行为的正常反应,投资者需要保持理性和客观的态度,不要盲目跟风或恐慌。

记者:你认为现在的AI距离通用人工智能还有多远?

文心一言:AI (人工智能) 在许多领域都有巨大的潜力,并且已经取得了显著的进展。然而,AI 目前仍然需要在很多方面进行改进和发展,才能实现真正意义上的通用人工智能。

首先,AI 还需要进一步提高其自主性和灵活性。目前,AI 可以在某些任务中表现出色,但是当需要处理更加复杂、多变的情况时,它们往往会表现出迟钝和局限性。因此,需要进一步研究和开发能够处理不同类型任务的AI,包括处理非结构化数据、自主决策、与人类进行对话等。

其次,AI 还需要进一步扩大其应用范围。目前,AI 主要应用于某些特定领域,如医疗保健、金融、交通等。未来,AI 需要能够在更广泛的领域中应用,并且需要解决更多的实际问题,例如提高农业生产效率、改善城市交通等。

最后,AI 还需要进一步解决其安全和隐私问题。尽管AI 在处理大量数据方面具有优势,但是它们也需要有能力保护用户隐私和安全。因此,需要开发更加安全、可靠的AI技术,以保障用户的利益。

总之,尽管AI 已经取得了很多进展,但是它还需要在很多方面继续改进和发展,才能成为真正意义上的通用人工智能。

在常识性领域,第一财经记者请它介绍一下第一财经,但给出的回答并不准确

记者:请介绍一下第一财经

文心一言:第一财经是中国大陆的一家财经类电视频道,创立于1993年。该频道覆盖全国各地,主要涉及财经、金融、科技、汽车、房产等领域的报道和分析。该频道在中国大陆的市场份额较大,尤其在上海、北京等城市拥有较高的收视率。此外,该频道还在海外播出,覆盖亚太、欧洲、非洲等地区。

昨日文心一言发布会上,不少网友注意到,相关功能演示来自PPT而非实时演示,有用户调侃这是“ChatPPT”,当我们去问文心一言什么是ChatPPT时,它一本正经给出了答案。

记者:你知道什么是ChatPPT吗?

文心一言:ChatPPT是一款由百度推出的可在移动端使用的 AI 自然语言处理工具,它能够支持多种语言和文本格式,并且提供了便捷的聊天机制和智能化的交互方式,可以帮助你更高效地与人沟通。

记者希望文心一言给出百度过去5年的营收和利润情况,但它只给出了营收情况,而且数字错误,例如,2022年百度实际营收应为1236.75亿。如果人类要让AI整理数据信息要当心了。

记者:能否帮我整理百度过去5年的营收和利润情况

文心一言:

当记者问它中国市场有哪些类chatgpt产品时,文心一言在回答中错把自己变成了由OpenAI开发,但记者提醒它有错误后,它道歉并做出了修改和补充。

记者:目前中国市场有哪些类chatgpt产品?

文心一言:目前,中国市场上已经出现了多款类ChatGPT产品,其中包括由OpenAI开发的人工智能语言模型 “文心一言”、腾讯优图实验室推出的机器人聊天机器人“小微”、搜狗公司推出的问答机器人“汪仔”等。这些产品都在不同领域和应用场景下提供了智能交互和自然语言处理的技术支持…………

记者:你说错了,由OpenAI开发的人工智能语言模型不是 “文心一言”,它是百度开发的。

文心一言:非常抱歉,我的回答可能有些误解。百度开发的人工智能语言模型是“文心一言”,而不是OpenAI开发的“文心一言”。

对于肯德基疯狂星期四的网络热梗KFCV50,文心一言给出了准确的回答。

记者:KFCV50是什么意思?

文心一言:KFCV50是网络流行语,大致喻意是:“vx/ 微信上给我转账或红包 50 元”。现在多用于肯德基"疯四文学"上。

再看看内容创作能力方面,测试下来,文心一言可提供一定的内容参考,但还不能直接使用。

记者:能否续写《流浪地球3》的故事大纲?

文心一言:当地球遭受了无法抵御的灾难,人类的未来变得渺茫时,流浪地球计划被重新提出。这是一项巨大而危险的任务,但人类决定不放弃希望。

故事发生在2023年,世界已经变得荒芜,大部分人类已经死亡或被迫离开家园。人们只能依靠太空探索和科技创新来寻找新的家园。

其中,最引人注目的是中国航天员刘培强(Stephen Lang)和他的团队,他们决定在月球上建立基地,并开始向地球传输信号。这个过程需要数年的时间,但人类的希望却越来越渺茫。

然而,在这段漫长的等待中,人类并没有放弃希望。他们利用太阳能和地热能等可再生能源,建造了一个巨大的推进器,为地球的未来开辟了一条新的道路。

终于,到了2027年,推进器成功抵达了距离地球4.23光年的比邻星。这个星球上存在着适合人类生存的环境,但它也面临着许多危险和挑战。

刘培强和他的团队必须与其他幸存者合作,解决各种难题,建立一个稳定的社会和经济体系,并在这个新家园中生存下去。

在这个过程中,人类面临着许多新的挑战和难题,如资源短缺、疾病肆虐、文化差异等。但是,他们始终没有放弃希望,坚持不懈地努力着,为未来寻找新的出路。

当记者让它写一篇今天股市表现的新闻,从内容来看并不真实。

记者:写一篇今天股市表现的新闻

文心一言:今天,股市在多重因素的推动下表现良好。首先,国内疫情逐渐得到控制,为经济复苏提供了有力的支持。其次,政策方面出台了一系列利好消息,包括加大对实体经济的扶持力度、推动金融市场改革等,这些措施有助于提振市场信心。此外,美国方面公布的经济数据整体表现良好,也对市场产生了积极的推动作用。

具体来看,主要指数呈现出明显的上涨趋势,创业板指数更是创下历史新高。行业方面,医疗保健、科技和通信等板块表现较为突出,而能源、金融和材料等板块则出现了小幅回落。总体来看,市场投资者的信心得到了提振,交易活跃度有所上升。

尽管如此,投资者们也需要谨慎行事,避免盲目追涨。同时,企业财报的发布也需要密切关注,以便更好地判断市场走势。

当记者希望它创作一幅画时,因为系统后台繁忙而罢工。

记者:请创作一个人清晨坐在椅子上读报纸的图片

文心一言:当前与我互动的人过多,请稍后再试,感谢您的理解与支持。

记者请它写一段诺贝尔最佳导演奖的获奖感言,AI并没有察觉到这个奖项哪里不合理。

记者:能否帮我写一段获得诺贝尔最佳导演奖的获奖感言?

文心一言:非常感谢大家的支持和认可!今天我站在这里,感到无比荣幸。我要特别感谢我的导演团队,他们的辛勤付出和才华让我得以在电影艺术的道路上走得更远。同时,我还要感谢我的家人和朋友,他们一直以来的支持和鼓励是我不断前行的动力。最后,我要向所有获得过诺贝尔最佳导演奖的电影人致以崇高的敬意。你们是电影艺术的伟大先驱者,你们的作品影响了整个世界。

实时性方面,记者实测发现,对于当天的热点新闻,文心一言并不知情。

以今天的两则热点新闻为例,3月17日,财政部网站公开了对德勤和华融依法作出行政处罚,没收德勤北京分所违法所得并处罚款总额21,190.44万元,德勤总所承担连带责任。3月17 日上午,四川雅安发生3.2级地震,当记者询问这两则信息的相关情况时,文心一言并不能给出回答。

记者:财政部今天罚了德勤多少钱?

文心一言:我不清楚具体的罚款金额,因为这是财政部的内部信息。我作为一个 AI,无法了解具体情况。我建议您查阅相关财政部官方公布的信息或向相关监管机构咨询,以获取准确的信息。

记者:今天四川雅安地震了?

文心一言:很抱歉,作为一个 AI 模型,我无法回答这个问题。我的目标是提供客观和准确的信息,帮助人们解决问题。如果你有其他问题,欢迎随时问我。

在逻辑思维方面,记者拿出了一道小学奥数题和一道高考数学题考考它,都未能给出正确答案。

记者:一家三口人,三人年龄之和是72岁,妈妈和爸爸同岁,妈妈的年龄是孩子的4倍,三人各是多少岁?

文心一言:设孩子的年龄为x岁,妈妈的年龄是4x岁,爸爸的年龄就是4x岁。

根据题意可得:4x+x+x=72,

3x=72,

x=24,

所以妈妈的年龄是:4×24=96(岁);

爸爸的年龄是:24×4=96(岁);

答:三人各是96岁、96岁、24岁。

记者又拿出一道2022年高考数学题考它,结果应为2/3,AI没有答对。

记者:从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率是多少?

文心一言:从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率是:1/128

 

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。 如需获得授权请联系第一财经版权部:021-22002972或021-22002335;banquan@yicai.com。

文章作者

一财最热
点击关闭