【环球聚看点】谷歌Bard整顿AI“乱说”,数学运算能力提升30%,支持表格导入

2023-06-16 23:11:29     来源:智东西

智东西

编译 | Glu

编辑 | 李水青


【资料图】

智东西6月13日消息,当地时间6月7日,科技巨头谷歌公司对其AI聊天机器人Bard进行了更新,提升了机器人逻辑与推理能力,并增加了表格的导出形式。

Bard是谷歌公司为了对抗ChatGPT和BingChat,在今年3月21日正式推出的一款聊天机器人。此次更新是谷歌继5月新增Bard图片回复功能后的又一次功能迭代,主要针对Bard的数学计算能力,预计能将Bard解决数学问题的能力提高30%。

一、结果的生成:不只靠预测,加入计算力

Bard这次的具体更新内容包括两个方面:

1、提升在数学计算、编码问题和字符串操作方面的能力;

2、提供了一个“到谷歌表格”的新导出选项。有了这个新功能,用户可以将Bard在其回答中创建的表格直接导出到表格中。

在第一项更新中,Bard使用了一种名为“隐式代码执行(implicit code execution)”的新技术,它可以让Bard编写和执行自己的代码。最新版本的Bard识别能根据逻辑代码的提示,在后台编写代码、对其进行测试,并使用结果来生成更准确的回答。

这大大提高了Bard的推理和数学能力,使其有能力解决高级推理和逻辑性较强的复杂问题。如:

15683615的质因数是什么?计算某人储蓄的增长率倒写单词“Lollipop”

Bard对倒写单词“Lollipop”的回复

Bard之前所使用的LLM(大语言模型)像是一个预测引擎。LLM根据提示,来预测可能进一步出现的词汇,进而生产回复,整个流程并不涉及精细的逻辑推理与计算。因此,他们有能力解决语言类、创造性任务,但却无法准确回答推理、数学等领域的问题

二、结合大模型与传统代码,准确度提高30%

这项技术的灵感来源是二分法,特别是丹尼尔·卡尼曼(Daniel Kahneman)的双系统思维模型,他认为人的大脑存在两个系统,并称之为系统1和系统2:

系统1是无意识思考,是快速的、直观的、毫不费力的,如一个乐手在演出现场即兴演奏,使用的就是系统1思维;系统2则需要耗费精力、保持专注,是缓慢的、审慎的,如人们运用数学运算、学习专业乐器演奏时,使用的是系统2思维。

以此类比:

LLM是在系统1思维下运作的——没有经过深度思考,快速产生文本;传统代码计算方法则与系统2类似——公式化、不灵活,但能产生正确的结果。

以做一道数学题为例,如果只使用系统1,那根本不需要解题方法,直接把想到的答案写出来就行了;但是加上系统2后,便可以运用加减乘除等数学方法去解题。

本次更新中,谷歌结合了LLM(系统1)和传统代码(系统2)的能力,来帮助提高Bard反应的准确性。谷歌称,在他们的内测数据集中,Bard解决计算类问题的准确性提高了约30%

即使这样,Bard也无法保证回应的绝对准确。Bard不会生成有助于提示响应的代码,它生成的代码可能是错误的,它也无法保证一定将执行的代码包括在其响应中。

结语:各大厂商关注机器人逻辑性,AIGC准确性将继续提高

6月1日,OpenAI宣布ChatGPT数学解题能力将大幅提升,现在,谷歌也宣布了Bard的数学计算能力提高了30%。

这向我们释放了强烈的讯号,即AIGC聊天机器人行业陆续在关注着AIGC解决复杂问题的能力、生成内容的准确性,并不断在以各种方式提升AIGC内容的结构化、逻辑性。未来,我们将享受到能力更强大、结果更准确的AI服务。

来源:Google官网

标签:

[责任编辑:news001]

为您推荐