“文心一言” 一言难尽

来源:爱集微 #芯视野# #百度# #文心一言#
20.9w

集微网报道 (文/陈兴华)“中国版ChatGPT”终于登场。3月16日下午,百度于北京总部正式发布新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏表示,业界对文心一言的期望值是对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高。

但他指出,在全球大厂当中,百度第一个发布了同类型、同级别的产品,因为微软是直接调用OpenAI,而谷歌、Meta、亚马逊并没有真正发布。

一定程度上,在ChatGPT的强力刺激下,文心一言颇有些“千呼万唤始出来”。不过,百度方面似乎并没有充分准备好。李彦宏也坦承,发布文心一言基于百度自身产品及合作伙伴需要,但根据目前内测中的体验,文心一言的能力确实还并不完美。

同时,文心一言并没有在资本市场为百度带来利好,其推出后百度股价跌幅反而扩大至近10%。但无论如何,百度依然代表了中国人工智能在包括图像、视频、语音等多模态的顶尖水平,而业界应给予中国公司耐心和时间,以及相信从大模型、算力到应用的整个产业链投资机会。

具备四层技术栈独特优势

随着ChatGPT在全球刮起前所未有的人工智能旋风,国内科技及互联网企业也纷纷加码布局类似技术产品,其中AI技术开发领头羊百度走在了热潮前沿。据悉,作为基于文心大模型推出的生成式对话产品,文心一言是继文心一格和文心百中后的系列第三款产品,于2月7日在内部正式立项,上升到百度集团优先级最高的项目,由CTO王海峰亲自挂帅。

对于为何选择在3月16日发布文心一言,李彦宏表示,一是基于百度旗下搜索、智能云、自动驾驶和小度等多个产品业务线发展的需要;一是百度的客户和合作伙伴都需要使用先进的人工智能技术。短短一个多月的时间,已有超650家合作伙伴宣布加入文心一言生态。

在发布会现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

从总体表现看,某种程度上文心一言具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性呈现出较高水平,并且在中文语料的数量和质量上具有特有优势。但正如李彦宏提及,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。

在技术层面,王海峰称,“文心一言在ERNIE及PLATO系列模型的基础上研发,六大关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。”其中前三项是大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度基于已有技术优势的再创新,也是文心一言未来越来越强大的基础。

经过十余年扎根研究,百度在人工智能领域已有自身底气。李彦宏表示,目前百度是全球大厂中第一个做出对标ChatGPT产品的企业,“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理等需要多年的坚持和积累,没法速成。”

他认为,百度是全球为数不多在“芯片-框架-模型-应用”四层进行全栈布局的人工智能公司。而百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

在建立起系列优势背后,为了实现人工智能发展鸿图,百度对文心大模型的资金投入已经不菲。财报显示,百度研发投入是营收的20%,但其中50-60%是和文心大模型相关的投入。对于实现文心大模型变现方式,专家指出,百度方面的策略是将先选择一批客户做初步的协议定价,然后再根据情况看市场迭代效果,但现在还没有太多清晰的商业化的方向。

与GPT差距将会大幅缩短

从架构体系来看,虽然李彦宏称百度在芯片层、框架层、模型层和应用层各层面都具备领先业界的自研技术,但在一些底层核心及关键技术上,百度与国外领先水平仍存在一定差距。有观点认为,目前文心一言总体应该可以达到ChatGPT60%-70%左右的水平。

在芯片层方面,据集微网获得的一份深度参与百度文心项目的专家会议解读纪要称,百度阳泉超算中心主要为文心一言做训练推理,主要采用英伟达A100以及寒武纪思元590等国产化产品。与A100对比,思元590要增加20-30%的工作量和时间。因此,文心一言的高优先级还是采用A100,而可以把控的测试用国产芯片。

对于框架层,据中国中国信通院发布的《深度学习平台发展报告(2022)》显示,百度飞桨超越TensorFlow和PyTorch,居中国市场应用规模第一。但在海外市场,ChatGPT采用的PyTorch深度学习框架已经扩大对劲敌谷歌TensorFlow的优势,逐步在行业占据主导地位。

随着大模型技术不断提升,多模态正成为生成式AI一个重要发展趋势。在发布会现场,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。有趣的是,文心一言能够生成四川话等方言语音,但视频生成能力则因成本较高,现阶段还未对所有用户开放。

专家认为,文心一言跨模态方面和GPT类似产品相比大概有一代到两代的差距,比如GPT-4可以做的事项百度至少要半年以后才能做,视频、图片生成要半年以后大概能有一个相对比较稳定、高质量的输出。目前,文心一言在高质量的文本形态生成上比较有把握。

另据行业人士称,内容的质量上百度文心和ChatGPT差距不是特别大,只是在内容的多样性上有差距。目前,国内研究相关的大模型主要靠工程人员和研发人员,大概几百号人或者上千号人。在这个过程中既没有引入类似OpenAI的用户反馈机制,也没有大量的用户在技术模型迭代过程中参与进来,所以在内容的多样性上会有所欠缺。

对于如何缩短与GPT-4的差距,百度方面的主要方式是基于现有研发资源,以及初级版本内测过程中的问题修复进行迭代升级。当前,文心一言初级版本0-1的过程中耗时比较多,但从1-100过程相对进度就会以非线性去迭代。专家指出,“现在看是半年(差距),之后根据资源投入不同去评估,应该会大幅度缩短。

值得一提,李彦宏在文心一言发布会上似乎夹带着一些紧张。对此,有网友向文心一言提问,得到的回答是:有一种说法是,李彦宏在发布会上的紧张是因为他感到自己对人工智能技术的掌握不够充分,他担心自己的演讲会被人工智能技术所超越或者被误解为自己在利用人工智能技术作秀,同时可能也感到自己可能面临着许多挑战和压力。

“总之,李彦宏在文心一言的发布会中表现有些紧张可能是由于多种原因所致。这些因素可能包括他的担忧和焦虑、他的角色和职责、公司运营的复杂性等等。”文心一言说。

(校对/张轶群)

责编: 张轶群
来源:爱集微 #芯视野# #百度# #文心一言#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...