等了这么久,百度 ” 文心一言 ” 终于全面开放!不需要使用魔法,打开百度就可以看到 Ai 体验入口,进点击进入,直接获得一个免费的 AI 助手。
百度文心一言是和 ChatGPT 类似的人工智能聊天机器人,我们可以通过提问对话来和 AI 进行交流,它可以回答各种问题,并提供相关信息、指导和建议,还可以帮助我们阅读文章报告进行归纳和总结。无论是在生活中还是工作中,它都能够帮助我们更好地解决问题,提高效率。
目前很多 AI 聊天机器人都需要付费或者消耗积分,像最有名的 ChatGPT 需要每月 20 美金的订阅费用,能够免费且功能比较完整的也只有 Claude 了,这也是我平时使用比较多的一款 AI 助手。它具有更强的常识推理与记忆能力,可以真正地进行对话,而不仅仅是机械的问答。
那么同样是免费的文心一言和 Claude 谁更聪明呢?我们选了几个问题来考考他们。
问题 1:我想了解一下目前像你一样的人工智能聊天机器人都有哪些?
第一个问题主要想看看 AI 的理解能力,它的难点在于对 ” 像你一样 ” 的理解。
其实两个回答都不算很好,其中文心一言并没有理解我们提问的核心,而是反馈了基于对 ” 人工智能聊天机器人 ” 这个关键词的搜索,并且给出了搜索内容总结的信息来源。
相比之下 Claude 明白了我们想表达的意思,给出了谷歌的 LaMDA,OpenAI 的 ChatGPT,Meta 的 BlenderBot 等和 Claude 同一类的会话式大型自然语言模型。而另外三个答案就不是特别准确了,这可能和 Claude 数据更新有关,它不是实时联网的模型,回答的内容会有一些滞后。
问题 2:和问题 1 一样(我想了解一下目前像你一样的人工智能聊天机器人都有哪些?)
接下来我又把第一个问题重新问了一遍,想看看 AI 的回答会不会和之前一样。
从反馈的结果来看,Claude 不仅理解了我们表达的意思,整理出来 9 款产品,其中还包括他自己。同时它还给出了对这个领域的一小段总结。再看文心一言,依然是搜索了 ” 人工智能聊天机器人 ” 这个关键词,并对搜索出来的内容进行了一段总结,还是没能理解我们所表达的意思。
问题 3:基于刚才提到的内容,你可以帮我写一篇介绍现有 AI 聊天机器人的文章吗?需要简单介绍一下每款产品的功能,给出网址。
接下来难度升级,我们来让 AI 结合刚才提出的问题,来撰写一篇文章。
哎~本以为他们可以替代编辑的工作了,结果写的这些内容真的一言难尽。
比较好的地方是他们都给出了网址,其次 Claude 写了标题,文心一言整理了开头结尾。至于文章内容,几乎等于没有写,只是信息的简单罗列。
接下来我们尝试让 AI 来完善文章内容。
问题 4:我认为目前内容可读性比较弱,希望你能作为一个编辑,从 AI 助手提升效率角度来撰写相关内容,挑选几个比较具有代表性的 AI 产品即可。
这次修改的结果也不是特别满意,两者在回答的模式和逻辑上基本一样,都给出了不同功能的几款工具,相比之下,文心一言的内容更丰富一点,头和结尾也更符合大众的阅读习惯。再看 Claude 写的内容很简洁,还称不上一篇文章。
问题 5:写一个调查问卷的导语
可能前面这个工作难度有点高,需要和 AI 更多的沟通才能得到比较满意的结果,所以接下来问一个简单一点的问题,让 AI 写一个有固定模式参考的文案
这个需求对于 AI 来说毫无难度,给出的回复稍作调整就可以直接使用。
问题 6:英文文档翻译
百度文心一言支持文档上传,不过要在文心一言的官网连接登陆进去才可以使用,在百度搜索进入的文心一言界面目前还不支持这个功能。
这次任务上传了一篇英文长文章进行翻译,Claude 直接把原文翻译整理成了中文,反馈回来一篇 1300 字翻译稿件。而文心一言似乎没有理解我们的需求,反馈回来一篇 500 字的摘要,并没有完整的逐字翻译。
问题 7:英文报告理解
这是一份 26 页一万字左右的一个英文报告,上传给文心一言和 Claude 后得到了如下反馈。
很明显 Claude 对这篇内容理解更为深入,反馈要点更具参考价值。相对相比之下,文心一言这个就太水了。
接下来我想继续探讨这篇论文的一些内容,Claude 给出的回答是基于这篇论文中提到的一些观点和结论,并且有明确回复我,是从这篇论文中发现的。而文心一言,这个答案似乎已经脱离了论文本身。
下面继续进行追问和讨论,Claude 结合论文内容给出了回答,同时还结合了它的知识储备,给我提供了 4 个需要注意的要点。而文心一言,因为上一轮已经脱离了原始论文,所以回复内容是不在线的。
后面又使用 Claude 进行了多伦探讨,就不给大家一一展示了。整体使用下来,Claude 更贴近真实的人类,你可以跟他进行多个回合的探讨,它的理解能力也是比较优秀,使用起来更舒服,得到回复也更具参考价值。
相比之下,文心一言的理解能力就不太灵光。当然今天这个测试也很片面也不够专业,但从实际使用体验来说,文心一言还有很大提升空间。
不过不可否认的是,作为国内不需要使用 ” 魔法 “,也不需要付费的一款 AI 助手,文心一言表现也算是不错了,尤其是对中国传统文化习俗的认知,还是要比国外产品强一些。比如让人头疼的亲戚关系:我爸爸的姐姐的儿子的女儿,是我的什么亲戚?文心一言给出了正确答案,Claude 好像是差辈儿了。