百度正式发布文心一言李彦宏现场Demo演示“五大能力”

百度文心一言迎来大考。

3月16日,百度正式发布文心一言。百度创始人、董事长兼首席执行官李彦宏在发布会现场表示,在发布之前,很多人问百度是否已经准备好,“从某种意义上说我们已经为此准备了多年,我们十几年前就开始投入AI研究,但也不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个,我自己测试感觉还是有很多不完美的地方。”

为什么不完美还要发布?李彦宏说,因为市场有需求,短短一个月,有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型,一旦有了真实的人类反馈,文心一言的进步速度会非常快,希望它快点成长。

从百度的发布来看,文心一言有五大能力:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,因此,李彦宏的演示也聚焦于这五个方面。值得关注的是,现场演示的均为提前录制好的demo。

用“鸡兔同笼”做数理推算,还做了一首藏头诗

李彦宏演示了文心一言对数理逻辑推算任务做的怎么样。鸡兔同笼是锻炼人类逻辑思维的经典题,这个对生成式AI同样有挑战。

第一个问题,我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果有一个笼子里有9个头,40只脚,应该有多少只鸡,多少只兔子?

经过测试,对于第一道题,文心一言经过演算,认为可能是题出错了。

第二个问题:我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果有一个笼子里有9个头,30只脚,应该有多少只鸡,多少只兔子?

第二道题,文心一言不仅给出了正确结果,还详细给出解题步骤。可以看出,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

那文心一言在中文语言的处理上,到底如何呢?

在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。在商业文案创作场景中,文心一言完成了给公司起名、写Slogan、写新闻稿的创作任务。

“多模态是生成式AI一个明确的发展趋势”

在文心一言发布的前一天,ChatGPT开发商Open AI公开发布了大型多模态模型GPT-4,与此前的GPT系列模型相比,最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本,而此前的GPT-3.5只接受文本。

外界认为,在GPT-4带动下,未来大模型以及多模态模型的商业化应用将进一步加速,百度的文心一言是否能做到多模态生成也是外界所关注的。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

产品形态趋于ChatGPT刚发布时

文心一言具体表现如何?李彦宏评价,文心一言从某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平,但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。

在外界看来,百度在往ChatGPT刚发布时的产品形态靠拢,更有业内人士指出,与GPT-4相比,文心一言还像是一个“刚出生的婴儿”。

李彦宏曾表示,百度的多项主流业务会与文心一言整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等,但从今日的发布看,百度并未提及与上述产品的结合进展,而是用一部分篇幅谈了生成式AI、大模型所带来的产业机会。

由此可见,百度给文心一言的定位,不仅仅是一个工具,而是一个通用的平台,百度想让各行各业来使用这个平台,进而创造价值。

李彦宏判断,大模型时代将产生三大产业机会,第一类是新型云计算公司,第二类是进行行业模型精调的公司,第三类是基于大模型底座进行应用开发的公司,即应用服务提供商,“今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。这里面的机会非常多,可以说每家企业在现在这个阶段都有机会。”李彦宏说。

在发布文心一言后,百度港股一度跌近10%,截至16日收盘,百度港股跌6.36%,报收125.1港元。