国产版ChatGPT要来了?

近日据媒体报道,知情人士透露,百度将于3月份推出类似OpenAI旗下ChatGPT的人工智能聊天机器人服务。

据悉,百度推出类ChatGPT风格的应用,一开始会将其嵌入到公司的主要搜索服务中。这一工具的名称尚未确定,但它将会让用户获得对话式的搜索结果,就像OpenAI的那个流行平台一样。

受此消息面影响,百度港股单日股价一度蹿升涨幅近6%,但日内收敛,收盘转跌0.58%报港币136.1元,成交值港币32.67亿元,量价均创逾七个半月新高。

前不久,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT在国内外掀起了一阵追捧之风。国外,谷歌、Meta、微软等科技巨头均在该领域积极布局;国内,ChatGPT成为A股热词,拓尔思、万兴科技、佳都科技等多家上市公司都宣布要开展由ChatGPT引爆的AIGC概念相关布局。

作为国内AI领域的代表企业,百度此刻率先出阵,意欲何为?ChatGPT式的产品,又能给百度带来何种想象力?

百度的保守式进攻

在ChatGPT发布的第一天,就有生成式AI要取代搜索引擎的声音出现,而这也是被业内人士讨论最多的问题。

其中,推波助澜作用最大的,莫过于开发人员Josh Kelly的那句感叹——Google is done。在这条爆火的推文下,不少共鸣者认为ChatGPT将有望撼动谷歌搜索的地位。

有意思的是,对于该称赞,ChatGPT“本身”却是最大的反对派。当你尝试用问题形式询问ChatGPT能否取代搜索引擎时,它给出的答案却是否定的。

“不太可能。ChatGPT是一个使用自然语言处理技术的对话式语言模型,它主要用于对话式的问答和聊天应用中,旨在模拟人类的对话行为。相比之下,搜索引擎是一种针对网络信息的检索工具,可以根据用户的查询请求,快速找到符合条件的网络信息。两者不具备相同的功能,因此ChatGPT不能取代搜索引擎。它们可以相互补充和辅助,共同为人类提供更好的服务。”

听起来,ChatGPT的回答似乎是“正确的废话”,不过也有业内人士为该观点站台。

长期从事NLP和推荐搜索相关研究张俊林发文分析,ChatGPT目前暂时还不能取代搜索引擎,原因有三:其一,如果提问者对于所提的问题不知道正确答案,那将无法作出判断的ChatGPT给出的结果;其二,ChatGPT对于LLM模型吸纳新知识是非常不友好的;其三,ChatGPT或GPT4的训练成本以及在线推理成本太高,想要兼顾用户基数和成本是个两难选择。

需要注意的是,尽管ChatGPT暂且无法取代传统搜索引擎,但不代表没有丝毫威胁。

亿万富翁Chamath Palihapitiya预测,随着人工智能的崛起,谷歌今年将受到最大的影响,因为人工智能开始让谷歌搜索功能变得不那么重要。这位风险投资家表示,谷歌可能不会失去其全球顶级搜索引擎的地位,但随着其他网站的加入(ChatGPT),谷歌仍可能失去相当大的使用量。

简单来说,Chamath认为从盈利能力和参与度的角度看,谷歌搜索是失败者:

- 其他公司将能够产生高质量搜索结果。

- ChatGPT直接给你答案,为什么还要搜索?

- 哪怕只流失10%-15%的使用量,是谷歌的巨大损失。

从国外大厂的动作来看,这种观点也比较有说服力。譬如瞅准机会想要挑战谷歌地位的微软。

据外媒报道,微软公司打算将OpenAI的ChatGPT聊天机器人引入其搜索引擎Bing(必应),以从强大的竞争对手谷歌那里抢夺市场份额。

有知情人士透露,微软相信,聊天机器人提供的更对话化、情境化的回复,会使搜索用户更乐意使用Bing,因为通过这种方式提供的答案毫无疑问要比直接抛出网页链接要更加优质。

作为回击,谷歌紧急发布“红色警报”。

根据《纽约时报》的一份内部记录显示,谷歌首席执行官Sundar Pichai参加了几次围绕谷歌人工智能战略的会议,并指示公司的许多团队重新集中精力解决 ChatGPT对其搜索引擎业务构成的威胁。

一攻一防之中,道理其实很浅显。

巨头们不愿错过任何机会,特别是随着人工智能技术进一步成熟,确实有再次错失良机的风险,而这是谷歌最不愿意看到的。

对于有着同样处境的全球最大的中文搜索引擎百度而言,此番出击也成了必然。说白了,ChatGPT能否取代搜索引擎,是未知的,但风险是已知的,因此最稳妥的策略便是攻防兼备、抢先布局。

实际上,早在1月初的百度Create AI开发者大会前夕,百度搜索就宣布将基于百度自研的生成式模型,升级“生成式搜索”能力。并指出,生成式AI和搜索引擎是互补关系而不是替代,而搜索底层技术和AI底层技术是相通的,百度从2021年就开始尝试把AIGC与搜索两者结合起来。

此外,百度自身在生成式AI领域也有一定的基础。据知情人士透露,百度的文心(Ernie)系统,一种经过多年数据训练的大规模机器学习模型,将成为其即将推出的类ChatGPT风格工具的基础。

对于百度,ChatGPT有什么想象力?

就如同,新事物的出现,往往会破坏原有的体系。在ChatGPT赋予百度更多想象力之前,首先需要考虑ChatGPT对于原有系统的冲击,这里主要指广告系统。

拿谷歌来说,根据谷歌母公司Alphabet公布的最新三季度财报,谷歌主要业务分为两类,一类是广告在内的服务业务,一类是云业务。而广告业务是谷歌的收入支柱。三季度,谷歌搜索服务的广告收入同比上涨4.25%至395.39亿美元,可谓是命脉所在。

具体而言,谷歌搜索服务的广告来源是多样的。其中,关键词竞价,就是广告主通过竞价来争夺搜索引擎结果页面上的显示位置或“排名”,而竞价金额和关键字设置方式将决定相对于其他竞价方的排名。

此外,广告主可以设计文字版广告,并将广告文案显示在用户的搜索结果中,或者创建可以显示关键购买信息(例如产品照片,价格和评分)的谷歌购物广告。

于是乎,问题就出现了。当采用ChatGPT的方式来进行搜索,如果系统直接给出对应的信息,自然会影响到广告的投放。前谷歌广告团队负责人Sridhar Ramaswamy也曾表示,ChatGPT的使用从一定程度上阻止了用户点击带有广告的谷歌链接。

据上述知情人士表示,百度计划在用户提出搜索请求时引入ChatGPT 生成的结果,而不仅仅是链接。因此,对于百度目前的广告系统而言,挑战也是存在的。

当然,也有机器学习行业人士表明,“从商业模式的角度,广告业务最大的关键点是平台的控制力,平台的控制力越大,粒度越细,变现的空间越大。这种直接给出答案的产品形态中,平台的控制力是最强的,怎么会担心商业化的问题。”

总之,ChatGPT对于原有系统商业模式的影响更多是悬而未决的,不妨再来探讨其对于百度可能带来的利好层面。

例如,百度此前一直梦寐以求的“框计算”会实现吗?2009年8月18日,李彦宏在百度技术创新大会上提出了这个全新的技术概念。

简单来说,“框计算”就是要在百度的搜索框里,几乎能够解决用户的所有需求,相当于百度成为一切信息乃至服务的入口。此后,为了完善“框计算”概念,百度先后布局“中间页”、“轻应用”,又大手笔投资或收购一些具有巨大用户需求的垂直平台,等等。

不过遗憾的是,随着移动互联网时代来临,百度想要“框”住一切的野望并没有得偿所愿。也正因此,市场的格局也发生改变,诞生了两种搜索引擎,通用搜索和垂直搜索。

所谓通用搜索主要为百度、谷歌等,无需过多赘述。而垂直搜索则主要是针对某一个领域的专业搜索引擎,是通用搜索引擎的细分和延伸。一般来说,和通用搜索不同,垂直搜索引擎的数据多来源于自身平台,当某一平台上的信息达到足够量大的时候自然形成,例如淘宝。

此前,市面上已经有分析人士认为,高度专业化的垂直搜索厂商对通用搜索平台将构成重大的潜在威胁。而百度若推出类似ChatGPT风格的应用嵌入到搜索服务后,借用生成式搜索的能力,由此或将引发一连串的蝴蝶效应。

此外,除了搜索引擎呢?譬如云业务,实际上微软已经这样做了。据外媒报道,微软公司将马上把OpenAI旗下的人工智能机器人 ChatGPT添加到Azure云平台中。

微软公司CEO萨蒂亚・纳德拉 (Satya Nadella) 发布推文称:“在我们帮助客户将世界上最先进的人工智能模型应用于他们自己的业务需要时,ChatGPT 很快就会出现在Azure OpenAI服务中,该服务现在已经普遍可用。”

同样,对于百度的云业务而言,作为一直强调在云计算市场中具备AI差异化优势的云厂商,云计算与AI的结合或将为其竞争日渐激烈的云市场中带来更多新变量。

写在最后

AI学者Tom Goldstein曾算了笔账,按照ChatGPT是基于GPT3.5的说法,它的参数量可能为1750亿。因此大约需要5个80GB的A100来加载模型和文本,ChatGPT每秒钟能产生大约15-20个单词,如果它使用A100,那么可以在8-GPU服务器上完成。

而在Azure上每张A100每小时3美元,通常ChatGPT一次响应会回答约30个单词,生成一个单词约350ms,所以每次回答大约需要花费1美分,也就是人民币约7分钱。

按照现在超过百万用户数据,以及一个人一天约有10次提问,估算ChatGPT一天提供1000万次回答是合理的。由此,粗略估计ChatGPT每天成本消耗有10万美元,实际成本应该肯定比这个高,毕竟并行效率不会是100%。来自摩根士丹利的分析师布莱恩·诺瓦克(Brian Nowak)估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。

对此,百度架构师辜斯缪曾表示,该技术很贵,所以在具体推出时还有很多改良空间,百度已考虑很多方案来大幅降低它的单次服务成本,但如果真的要推出,也需要投入一定比例的资源维持。对于百度而言,甚至还要考虑公关问题(谷歌高管曾出于对“声誉风险”的担忧,不愿在目前的状态下发布人工智能系统LaMDA)。

显然,即便业界对于ChatGPT的热情超过了预期,但客观来说,考虑到成本和缺乏行业知识积累,ChatGPT要真正做到商用,仍还有很长一段路要走。

当然,随着ChatGPT距离人工智能越来越近,对于现有商业格局势必将产生巨大挑战,百度、谷歌之外,其他领域的商业巨头们也该保持警惕了。