由AI开启的科技大航海时代已经到来,这一点无需多言。但如何为无数开发者和用户降低门槛,扫清AI应用的障碍,行业需要领军者来制定标准,架起更便捷的梯子。

一年前,在AI风暴刚刚席卷世界时,百度便在国内率先发布了自研大语言模型。一年后,当文心大模型的调用量已稳居国内头部时,百度又在尝试树立起新标杆。

4月16日,百度创始人、董事长兼首席执行官李彦宏在“Create2024百度AI开发者大会”上,对AI世界的蓝图发出畅想:“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”

他向在场观众介绍了百度三大“开箱即用”的AI开发神器,这三大神器瞄准了普通用户与专业开发者的日常痛点,将极大降低应用开发和模型精调的门槛。

李彦宏也同时指明了百度的AI愿景:“作为一家技术公司,百度的角色定位,就是尽可能地为大家提供所需的开发工具,不断提升整个社会的创造力。”

01、三大神器,扫清AI开发障碍

理想情况下,未来开发一个AI应用将会有多简单?李彦宏的答案是:难度大概会和“拍个短视频一样”。

为了推开大模型时代的大门,百度正在致力于帮助开发者极致地降低使用难度。李彦宏表示:“最快只需三步,开发者就可以用自然语言开发出一个AI原生应用。打开开发界面,第一步给应用起名,第二步填写角色指令,第三步再插入需要的工具组件。”

这样简洁到极致的开发过程,要走过的研发路径是极其艰辛的。传统而言,基础大模型与AI应用之间,需要历经许多链条。

如一位开发者在“百度开发者中心”网站中所发布的《AI原生应用速通指南》中写道:“AI原生应用开发涉及需求分析、数据准备、模型训练、部署上线、监控与优化等五大流程。”而且,每个环节还各有子流程,环节中对于开发者的编程能力也有所要求。

为解决这个问题,百度推出了AI原生应用开发神器AppBuilder。在其中,百度提前封装和预置了开发AI原生应用所需的各种组件和框架,以此大幅降低开发门槛。同时,该神器具备跨模态能力。例如,开发者给出一段文字,就可以快速创建绘画类应用。因此,AppBuilder也被李彦宏描述为“最好用的AI原生应用开发工具”。

在此之上,百度同时推出了文心智能体平台AgentBuilder。当下,能帮助执行复杂任务的“智能体”概念,正成为业界共识。比尔·盖茨曾在其官方博客中预测:“一个全新的技术——AI私人助理智能体——将普及至每个人的日常生活中,而不仅仅局限于办公室工作。”

而AgentBuilder的设计,则是为普通用户在创建智能体的过程中,扫清编程壁垒。

根据李彦宏的演示,打开文心智能体平台官网后,创建页面显示为“零代码”“低代码”两种模式,新手可以直接选择“零代码模式”,用自然语言描述需求,只需几句话就能创建一个智能体。一个账号最多可以创建50个智能体,单个智能体还能承载10个数据集。

同时,AgentBuilder已经能够为开发者提供百度生态流量分发路径,完成“开发+分发+运营+变现”一体化的商业闭环。李彦宏透露,截至目前,已经有3万多个智能体被创建,5万多名开发者和上万家企业入驻了AgentBuilder。

相较于前两款面向普通用户的开发神器,ModelBuilder更多是从MoE(Mixture of Experts,混合专家)的思路出发。对此,李彦宏特别解释道:“MoE不是一般的学术概念,而是大小模型的混用,不依赖于一个模型来解决所有问题。”

ModelBuilder更聚焦专业开发者,可以让开发者根据需求定制任意尺寸的模型、并根据细分场景对模型进一步精调。ModelBuilder预置了文心大模型“家族”,其中包括了旗舰版大模型ERNIE3.5和ERNIE4.0,适合通用的复杂场景;三个轻量级大模型,ERNIE Speed、Lite、Tiny;以及两个垂直场景的模型。

此外,ModelBuilder也支持国内外第三方主流模型,总数量达到77个,可以说是国内拥有大模型数量最多的开发平台,便于开发者按需选用。

02、将AI原生应用拉下神坛

前不久,抖音大V博主李一舟因售卖AI大模型知识付费课程爆火。虽然后来他被指存在盗用模型、非法经营等问题,课程遭到下架,其个人账号也被禁止关注。不过在被“打假”之前,据媒体报道,李一舟已凭借定价199元的AI课程实现了年营收5000万元。

无数普通用户能被李一舟“收割”,背后正反映了普通人对于大模型应用开发的迫切需求。

然而,世界上现存的编程语言已经多达约600种,一个成熟代码工程师的成长周期更要长达几年。过去,普通人在AI的开发需求和开发能力之间,存在几乎难以逾越的技术壁垒。

如何降低大模型的落地门槛,也是当下整个创造市场所关注的难题。正因如此,“大模型中间件”的概念也应运而生:它是在底层大模型和上层应用之间的中间层基础软件,主要用于解决大模型落地过程中,集成数据、应用、知识库,以及大模型融合级功能协同等问题。

当下,“大模型中间件”市场仍处于早期发展阶段。在国内最早发布自研大模型的百度,也很早就意识到了这一问题。2023年,李彦宏就曾简明扼要地讲道:“大模型本身并不产生价值,基于基础大模型开发出来的应用才是模型存在的意义。”

而前述的三大应用开发神器的推出,恰好精准击中了用户缺乏代码能力的痛点,也回应了行业填补中间件市场空白的需求。

在演讲中,李彦宏现场演示了在多个场景下,如何借助“三大神器”完成开发的过程。

比如想创建一个“新加坡旅游局”智能体,让其设计旅游方案、解答相关问题、提供酒店门票预订服务时,用户只需要借助AgentBuilde就能轻易打造出一个基础智能体。

随后通过高级配置,用户还可以把新加坡百科词条、官网链接都添加到知识库里,让智能体每天更新;并通过添加酒店查询、景点门票购买等工具,进一步增强智能体的服务能力。

如今,这样的智能体已不是空中楼阁,而是正在快速落地、成为现实。除了新加坡旅游局,现在大连、沈阳等文旅类智能体都已在文心智能体平台上线。

李彦宏还现场演示了如何“三句话打造AI原生应用”。他分享道,今年年初,华北电力大学提出希望为全校师生提供智能化的专属服务,而AppBuilder正可以满足这一需求。

在他的演示中,用户在打开AppBuilder进入创建页面后,第一步仅需点击AI自动生成配置,为应用设置名称、简介、头像等基本信息;第二步用自然语言在角色指令中描述任务、组件能力、要求与限制等具体要求;第三步,只要插入自定义的图书借阅查询、课表查询、成绩查询等组件,校园助手就基本具备了智能化服务的能力。

而在应用ModelBuilder方面,李彦宏演示了一款作文批改模型。ModelBuilder先是对原始的180条数据进行了数据清洗、数据标注和数据增强;接下来在用户选型ERNIE Speed作为基础模型后,给出推荐值来帮助精调;最后把模型部署在平台上。经过上述步骤,精调后的大模型便拥有了更加专业的老师点评思维,能够更好完成格式批改等工作。

简而言之,无论是个人还是组织的AI开发需求,未来都能通过上述“三大神器”找到解法。

03、做AGI生态的领路者

除了三大神器,李彦宏还在本届Create大会上发布了备受外界关注的“文心大模型4.0”的工具版。

升级后的文心大模型,将更便于用户体验代码解释器功能,允许用户通过自然语言交互,实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点,分析变化趋势,为后续的决策提供高效精准的支撑。

李彦宏表示:文心大模型历经不断的优化迭代,已成为全国调用量最高的大模型。相比一年前,文心大模型的算法训练效率提升到原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

日益完善的强大基础模型系列,加上三大AI开发神器,共同组成了一个强大的AI工具箱,支持开发者打包带走,随取随用。

过去一年中,百度不断探索打通从大模型到AI原生应用之间“最后一公里”的解决方案。而在这些成绩背后,百度也付出了身为探索者的代价。李彦宏讲道:“这是百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”

2023年6月,百度发布了基于文心大模型的智能代码助手Comate。如今,Comate不仅支持100多种语言和所有主流IDE平台,还可以推荐代码、生成代码注释、进行代码续写等等。Comate生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。

这只是百度大模型落地尝试的冰山一角。在智能驾驶、智能硬件等诸多市场,都能看到百度对大模型落地的不断突破和尝试。

之所以对AI原生应用开发、降低大模型应用门槛如此执着,更宏观的原因在于百度想要完善整个AIGC市场生态的愿景。只有不断降低模型使用门槛,让每个人、每家企业都打开那扇解放生产力的“大门”,真正的AGI(通用人工智能)时代才有可能尽快到来。

如李彦宏所言:“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系。国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”

当大模型开发从一小部分专业人士的游戏,变为普通人用自然语言就可以完成的工作时,我们距离AGI的实现,才算真正的近了一步。