Google一雪前耻,“AI版搜索引擎”,简报、试算表、Cloud也导入!Bard更大进化

Google I/O年度开发者大会于北京时间5/11凌晨1点登场,在近期的AI大战中,身处暴风中心的Google无疑受到瞩目,也成为大会中占据最大篇幅的话题。
Bard导入新的模型PaLM2,提升逻辑、程序等能力,功能也因此大幅提升;另外在搜索引擎、Workspace、Cloud也都导入不同的AI功能,展现生态是全面参战的决心。
在Google I/O现场直击,这次端出哪些好菜?
搜寻新时代展开,Snapshot帮你整合搜寻资料
随着Bing导入生成式AI对话功能,人们开始发现搜寻的模式可能要开始改变了,从片断式的资讯进入整合的时代。Google身为搜索引擎市占率93%的巨头,这次在搜寻介面推出新形态呈现方式,捍卫自己最核心的领地。
新功能叫做“Snapshot”,会把搜寻到的资料全部整理在最上方,并且点进去可以浏览所有资料来源,让你可以进一步点进去观看连结。

假设你想知道“带不到3 岁的幼儿和狗出游,去位于美国的布莱斯峡谷国家公园还是拱门国家公园比较好?”通常可能需要分成几个小问题分开提问,浏览广泛的资讯后再自行整理出答案。但有了生成式AI,Google搜寻会直接汇整值得你参考的重要资讯。
在汇整资讯下方,还会建议你继续问问题,例如“带小孩去布莱斯峡谷国家公园,应该待多久?”,点击这些建议内容,就能进入全新的对话模式,针对你想进一步了解的主题继续往下询问Google。
搜寻中的AI功能目前还在Search Lab实验计划中,任何人都可以登记排入测试队伍。
选择障碍?生成式AI协助你购物
这项功能也可以帮助在买东西前进行地毯式搜索的流程,生成式AI会直接帮你根据新的评论、评分、价格资讯以及产品描述等内容,推验产品给你。

这项生成式AI购物功能是建构在Google产品资料集Shopping Graph 之上打造而成,因此不像其他训练好的模型,可能是几年前的资料库,Google拥有及时更新变动的产品、卖家、品牌、评论和商品目录等超过350 亿笔产品资讯,Shopping Graph更是每小时都会更新重整超过18亿笔商品列表,提供及时且可靠的搜寻结果。
Bard“脱胎换骨”,功能五大升级
Google于今年3月发布的AI人工智慧聊天机器人“Bard”,基于LaMDA的大型语言模型打造,迎战来势汹汹的微软Bing聊天机器人,由于发布会在短时间内紧急登场,Bard一度出现答错的情况。经过两个月的整备,在这次I/O中祭出更完整的功能,同时取消候补名单机制,即日起开始在180多个国家地区,让所有想加入测试的用户都能一起体验。
Bard从LaMDA升级至全新PaLM 2语言模型中,大幅增强逻辑、数学、因果关系的理解能力,同时程序语言能力也更强,支援超过20种程序语言,可以生成也可以协助Debug,Google同时也预告,下一代更强大的模型Gemini已经在开发当中,由新合并的Google Brain部门推进计划。
一、可用图片回应
现在Bard的回应不只会生成文字了,第一个更新是可以产出图片,例如被问到“纽澳良有哪些必去景点”时,会在结果页面配上照片,让你看看当地的风景,选择时可以参考比较。
二、可以分析理解图片
这次Google把视觉分析的智慧镜头Google lens的功能也放进去Bard之中,让Bard增加对图片内容的分析理解能力。例如贴上两只狗的照片,什么也没解释,就请Bard协助生产有趣的文案,Bard会自行理解图片中出现的狗品种,并提供几个相关文案供用户参考。

三、和Adobe联手推生成图片
除了现成的图片,Bard还和Adobe Firefly“强强联手”,导入生成图片的功能,可以请Bard为7岁的女儿做一张“独角兽吃蛋糕”的图片,Bard就会直接按照指令生成后提供给你。

Google Bard和Adobe合作,可以直接在对话中帮你生成图片。
四、可以结合其他Google功能,如地图、Google试算表
在大会中展示了一整段实作,更好地呈现Bard的使用方法,同时看见Google的AI应用在整体生态是的串联应用。
假设自己是一位18岁、正想要申请大学的用户,想请Bard建议自己,在兴趣之上可以深入去研究的科是有哪些。在Bard列出一连串可能的科是清单后,想继续了解哪些大学会有相关科是可以就读?哪间大学离家最近?此时Bard会直接把地图贴进来让你看看地点,点进去也能打开Google Map直接串连。

Bard对话中嵌入Google Map提供参考。
接着可以请Bard把内容做成一张表格的形式,并随时进行内容调整,例如下指令加入显示大学是“私立或公立”的栏目,最后还可以自动汇出成Google试算表,进行后续的编辑与协作。
五、开发者使用三大需求
对开发者来说,用Bard作为助手来协助编写程序是很重要的日常应用,Google在采纳开发者的建议后,加进了几项全新功能:
1.来源引用:
为了让开发者不只是看到成果,可以深入探究程序背后的原理,并且检视正确性,从下周开始,如果Bard引用了一段程序码或其他内容,只需点击“标注”,Bard就会把引用的部分标记底线,并且连结来源出处,让开发者可以点进去参考。
2.深色模式:
开发者和工程师通常习惯使用黑底的介面写程序,能够减少对眼睛的负担,Google宣布即日起推出深色模式,在开发者大会现场响起欢呼声和如雷掌声,可以感受到开发者们对这项更新有多期待。
3. “汇出”选项:
Google在测试中观察到许多开发人员很喜欢汇出其他应用程序的功能。因此和提供线上开发平台的Replit合作,可以直接把Bard对话框中的程序码汇出到Replit并执行,首先支援Python。
除此之外,用户也经常请Bard协助草拟电子邮件和文件,即日起也推出两个新的汇出选项——Gmail和Google文件,可以不用复制贴上直接帮你无缝转移。
Google也在大会中预告,未来Bard会从PaLM2再升级到下一代的Gemini model上运行,这是DeepMind和Google Brain合并后一直在进行的计划,很快就会有消息更新。
Bard先前只提供英文一种语言,这次宣布增加韩文和日文可以沟通,未来预计会推出40种语言。不过Google也在会后的问答时间被问及,为何Bard不能像ChatGPT一样,上线时就用多种语言和用户沟通?
DeepMind 首席软体工程师戴明博回应指出,Bard已经建构在超过100种语言的模型上了,因此并不是因为技术上的困难,而是在不同语言中挑错、确保符合道德和避免“有毒”言论的过程,会花费更长的时间修正调校,在审核过程中会利用层层关卡确保Bard的言论不会脱离轨道,因此才会让推出不同语言版本的速度缓慢下来。
全能助手“Duet AI”
Google这次还推出了一个对话式AI机器人“Duet”,对标Microsoft 365中的Copilot,能够在Google Workspace和Cloud当中作为最佳助手,用自然语言对它下指令,请他协助生成内容,还会自动向你建议下一步该做什么,在你选择后继续往下生成新的内容。
一、 Google 简报中生成原创图片、讲者笔记
如果想在简报中放好看的图片,就可以请Duet AI直接帮忙做一张出来,若成果不满意,选择照片、漫画等图片风格,就可以再生成其他版本供使用。
Google Duet AI可以为简报生成图片。
这项技术的强大之处,在于能够从无到有绘制不曾出现过的内容。举例来说,营销人员和代理商进行初期的创意脑力激荡时,能够提供多种不同的选择、风格,帮助确立的图像视觉,避免来来回回的工作量。
除此之外,Duet AI还可以自动针对简报中的图案,针对每一页生成讲者笔记,减少重复工作量。
二、Google Cloud供企业使用的Low-code工具
Duet AI导入GoogleCloud中的生成式AI平台Vertex AI后,成为针对企业客户的超级Low-Code应用程序开发工具。可以选择想要的模型,直接在平台中调校,或是在介面中和AI的“聊天室”,打下想要做出来的应用程序功能,Duet AI就会提供你应用程序语言的建议。由于是企业级的功能,Duet AI在这里会完全确保Data只为了你自己训练。
Google Cloud 生成式AI三种模型
1.Imagen:产生图片
2.Codey:生成程序码
3.Chirp:生成语音
喊出“大胆但负责任的AI”,巨人的下一步怎么走?
Google在AI领域深耕多年,早在6年前、2017年的I/O大会上,执行长皮蔡就已经宣告Google是“以AI为核心的公司”,加上身为手握海量数据的搜索引擎巨人,站在AI领域的制高点,从去年12月开始的数月间,Google却在自己擅长的领地屡次遭微软强力挑战。
因此这次的大会明显具备关键的“叫阵”意涵,Google一口气发表25项架构在新大型语言模型PaLM2上的功能,PaLM2为了开发的灵活度,共分为四种大小规格:Gecko、Otter、Bison和Unicorn,能够更广泛地应用在产品上。因此从核心的搜寻、Google Cloud事业体,到安卓、地图等终端应用,全部都加上了AI的引擎。
今年Google喊出了“大胆且负责任的AI”的口号,宣告技术没有落于人后,而是要专注于安全可信赖的应用,在其他科技大厂都投入竞赛的阶段,能否继续坚守阵地,巨人的下一步值得期待。