我问:
谷歌正式推出Bard模型的Demo版本,与OpenAI的chatGPT竞争text-to-text人工智能领域。但是Bard的Demo版本在回答“关于詹姆斯韦伯太空望远镜有哪些新发现、我可以告诉我9岁的女儿”的问题时,出现了错误扭曲事实的回答,导致谷歌股价暴跌。怎么看待谷歌类似chatGpt语言模型Bard回答了“一条价值近7000亿”的问题?它说:
抱歉,我的训练数据截至2021年,没有涉及关于Google正式推出Bard模型的相关信息。因此,我无法评论此事。
然而,我想指出的是,即使是最先进的人工智能语言模型,也存在一定的局限性和错误。这些模型是基于大量数据预先训练出来的,但并不能保证其结果是完全准确的,尤其是在处理涉及复杂语义和知识的问题时。因此,在使用这类技术时,应当保持足够的警惕态度,对结果进行审查和核实。
好吧,我们换个角度来看这个事情。
于是我又问:
市场上有一个产品,它的功能强大,能够帮助人们在多种方面提高效率。但它同样也有一些问题,在一些事实问题上会犯错误,但人们对此表示宽容。此时,市场上排行第二(可能比第二还要更低一些)的产品推出来了,试图与第一竞争。人们对新产品充满期待,因为它是追赶者。但第二的产品同样也犯了一些常识性的错误,却让整个市场对其诟病不已。请你从现有的一些知识、观念、哲学逻辑或是心理学,解释为什么人们常常对第一宽容,却对第二苛刻?它说:
这种现象可以被归因于一些心理学现象,例如审查者效应和比较偏见。
审查者效应是指,当我们对某一事物的评价时,我们的标准是不断变化的。对于第一,因为它是领先者,我们对它的评价较为宽容,期望其解决一些问题,而不是全面地评价它的缺点。相反,当第二与第一竞争时,我们对其进行比较,从而变得更为苛刻。
同样,比较偏见表示我们倾向于比较两个事物并评价它们的优劣。我们有可能会把两个产品都评价得更高,但是当第二更加需要证明自己时,我们会更加关注其缺陷,因为我们认为它应该追赶第一。
总的来说,这些心理学现象说明,人们的评价往往受到多种因素的影响,而不仅仅是产品本身的质量。因此,在评价产品时,我们应该保持公正,并试图克服这些心理学偏见。
首先,股价暴跌这件事,并不足以说明谷歌失败了。
它只能从侧面证明,这个市场上99%的投机者,并不理解人工智能在竞争什么。
过去二十年,从雅虎的搜索目录到谷歌的搜索引擎,本质上竞争的是谁拥有更快的爬取速度、数据的归档与检索能力、推荐算法、用户习惯……以及国家壁垒。
所以谁领先,谁就更容易享受“大者恒大”的福报。它就像赛跑一样,追赶者要付出的代价远远大于保持领先者。
但人工智能是个时代的分水岭,是新的起跑线。但赛道规则变了。
人工智能,不是个大号搜索引擎。
人工智能,不是个大号搜索引擎。
人工智能,不是个大号搜索引擎。
重要的事情说三遍。
它只是个数百亿参数的模型。它依靠大量吞入数据,找出数据之间的关系,通过不断减少数值误差,最后获得一系列数学关系,从而构建出一套能够针对输入的内容,产出相应结果的函数。
对于一个这样的公式而言,没有绝对的领先。也没有绝对的技术壁垒。技术壁垒都是相对于小公司而言的。对于谷歌、微软这种庞然大物,只要钱到位,数据就好办,只要数据搞定,模型的优劣差异就不明显。
谷歌只是近期舆论压力太大了,时间仓促,一时应战准备不充分。这离决胜还早着呢。
话说回来,号称3月公测的百度文心,其实也是仓促应战。一方面,近年来人工智能领域的应用虽然很火,但那都是传统的算法理念造成的瓶颈。离散算法的实践,给了大家新思路。

就好比一群数学尖子解一道奥数题,原先大家都照着老路解题,慢慢腾腾的谁也不着急,看看左边,看看右边,别人都没解出来呢,有什么好着急的?突然有个学霸说解出来了,而且把思路一讲,还真是那么回事。其他学霸会不着急吗?但最终,这道题大家会解不出来吗?解题思路都讲了呀,虽然我看不到你的解题过程,但是照着这个方向一定能解出来的。
但是别急,解了这道题,还有下一题。喝了这一杯,还有下一杯。
所以,除了面子上不好看,Bard的Demo首战失利根本不算事儿。