过去几个月,ChatGPT 掀起的浪潮一刻也没有停歇,包括国内大量公司和科技从业者在兴奋于 ChatGPT 出现的同时,也在期待中国自己的 ChatGPT。在所有宣称将要推出类 ChatGPT 产品或大语言模型的公司中,百度是最早官宣的一批,也是第一个选择正式发布的公司。
3 月 16 日,就在 GPT-4 重磅升级的两天后,百度如期在北京总部正式发布了旗下大语言模型——文心一言。发布会现场,百度创始人兼李彦宏展示了文心一言在文学创作、商业文案、数理逻辑推算、中文理解和多模态生成五个方面的能力。
图/ChatGPT
一个值得注意的问题是,如果不强调中文名,ChatGPT 会自然倾向使用英文名。
就像我们在之前的文章中提到的,OpenAI 在训练 GPT-3.5 和 GPT-4 大语言模型时的语料库、基准测试和开发人员都是以英文为主,所以 ChatGPT 在英文的理解和生成能力胜过包括中文在内的其他语言。
这也是百度的优势所在。
百度可能更懂中文尽管在整体能力上,很难期待百度一跃超过 ChatGPT 和 OpenAI,但百度文心一言相比 ChatGPT 在中文信息的可靠性上可能会有一定优势。除了上面提到的语言倾向问题,ChatGPT 不论是 GPT-3.5 还是 GPT-4 版本,训练用语料库都截止于 2021 年 9 月,在涉及很多未知信息时容易编造内容,比如在介绍电视剧《三体》演员阵容时再次「胡编乱造」:
图/ChatGPT
相较之下,百度文心一言和微软 Bing Chat 都正确指出了具体的演员阵容,Bing Chat 还提醒了我们另一个 Netflix 版本的电视剧《三体》。
发布会上,李彦宏表示,百度和文心一言更懂中文和中国市场,甚至单独在五个环节中设置了「中文理解」的环节来展示。以百度官方演示的「洛阳纸贵」为例,ChatGPT 再次出现了「幻觉」,文心一言和 Bing Chat 基本指出了正确典故,但接下来只有文心一言正面回答了「当时洛阳的纸到底有多贵」:
图/百度
当然,考虑百度选定的问题以及录屏的形式,还很难就此断定「文心一言在中文上比 ChatGPT(GPT-3.5)更强」,但可以肯定的是,「中文」的优势一定是百度乃至未来中国类 ChatGPT 产品发力的重中之重。
而同时百度也展示了自身在行业应用上的优势。李彦宏引用百度在人工智能上的四层架构——(AI)芯片层、(深度学习)框架层、模型层、应用层时谈到,百度的多层架构协同效应将推动 AI 实现更快的迭代速度,以及在应用上也会有更高的效率和成本。
文心一言主要分为两部分,一部分是面向普通用户,通过嵌入百度搜索,用户可以直接与文心一言大语言模型交互,预计类似微软的 Bing 搜索和 Chat 的形式;另一部分面向企业客户,提供上述提到的四层人工智能全栈能力,从底层的云计算能力到深度学习框架,再到大模型和应用。
图/百度
事实上,百度相比 OpenAI 更早开启了 AI 大模型的商业化进程,在百度文心大模型的官网就展示了与不同领域大公司合作开发的行业大模型,此外还宣布已经有 650 家合作伙伴接入了文心一言,包括之前官宣的魅族、携程、兴业银行、美通社等。
但最终百度还是在用户侧证明文心一言的表现实力,否则从合作伙伴到客户到头来只会放弃百度。
百度必须拥抱 ChatGPT我们高估了 ChatGPT 的意义吗?比尔·盖茨将其比作互联网的诞生,微软 CEO 纳德拉说它堪比工业革命,英伟达 CEO 黄仁勋称其为 AI 的「iPhone 时刻」。
我相信,但好像也无法笃定未来一定属于类似 ChatGPT 的产品,不过可以肯定的是,ChatGPT 将改变搜索引擎的产品形态和业务模式。在这一点上,去年广告收入(包括搜索广告收入)占比分别为 60%和 77%的百度、谷歌都一样,必须面对 ChatGPT 带来的冲击和变革。
另一方面,百度和谷歌在很早就率先拥抱了 AI 技术,并在长达十年的时间跨度上重金投入研发。百度在 2022 年将全年核心收入的 22.4%,即 214.16 亿元投入了核心研发,而据欧盟委员会发布的报告,谷歌在 2022 年更是投入了 279 亿欧元研发经费,居全球第一。
但在 ChatGPT 之前,庞大的研发积累始终没有找到合适的商业化出口,颇有些「英雄无用武之地」。
ChatGPT 带来的突破确实带来了出口,或者说风口。当用户、开发者和企业客户都在拥抱 ChatGPT,百度不可能放弃,就像李彦宏说的,文心一言没有准备好却还是要发,是因为有市场需求。
题图来自百度
相关文章
猜你喜欢