登陆注册
13572

Meta AI科学家:大模型远未到一家独大,更相信开源的力量

锤子财富2023-07-21 18:30:410
开源模式搅动大模型竞争格局。

“OpenAI 不Open。”这是业界对于明星公司OpenAI“不开源”的一句吐槽。尽管这家公司分享了大量GPT-4的基准、测试结果和生动的演示,但对用于训练该系统的数据、成本或用于创建它的具体硬件或方法等相关信息“守口如瓶”,对于是否开源也没有时间表。

两天前,社交巨头Meta举起了开源的大旗,发布了最新一代开源免费可商用大模语言模型Llama2,将免费提供给研究者和商业使用者。有意思的是,和OpenAI紧密捆绑的微软也是Llama2的首选合作方,该大模型将通过微软云Azure分发,并将在Windows操作系统上运行。

这是大型科技公司里第一个宣布开源商用的大模型。Meta开源的做法也被视作是向OpenAI的GPT-4和谷歌PaLM这两个大模型重量级“闭源”玩家发起猛烈冲击。Meta在官网文章中表示:“我们相信,开源的方法是当今人工智能模型发展的正确途径,尤其是在技术进步日新月异的生成式领域。”

“我们的思路和OpenAI不太一样,OpenAI是一个比较close的模型,但我们相信开源。”7月21日,在“数据智能创新与实践人工智能大会”的线上讨论中,当被问及开源大模型Llama2时,Meta AI科学家Xin Liu这样说。

如同移动互联网时代以苹果为代表的封闭模式和以谷歌安卓为代表的开放模式,大模型因其不确定性形成了开源模式和闭源模式同时推进的基本格局。Xin Liu认为,现在大模型行业远远没有形成被某一家垄断或是一家独大的局面,每个公司、每个人都有很多事情可以去做,不论是做训练、做本身的技术加速或是数据的处理、应用层面等等。他还鼓励国内的从业者在AI技术领域做更加深入的推进。

Xin Liu举例,尤其对于那些中小企业而言,它们自己没有足够的能力和资本去训练一个大模型,但通过开源的方式,它们可以利用Llama2,结合企业自身的数据、具体的应用场景进行相关的优化。

对于这一轮由OpenAI掀起的大模型热潮,Xin Liu认为,不论谷歌还是Meta,巨头们都是很快自上而下地对通用人工智能、数据中心进行了大规模的投入,包括Meta公司内部也在拥抱生成式人工智能这一技术。他还透露,Meta内部已经有一个类似于ChatGPT的工具,可以在内部做代码的搜索、代码的生成,当员工去问它一些公司内部的问题,也可以通过该工具得到答案。

大模型不同路线的背后,开源模式正在搅动着大模型行业已有的竞争格局。

在今年5月,谷歌一份泄露的内部备忘录就预测了开源系统将蚕食闭源系统的可能性:“我们没有护城河,OpenAI也没有。”内容中还提到,不同开源模型所组成的生态系统永远是OpenAI的潜在竞争对手。这份文件引发科技界的广泛关注。

不久前的世界人工智能大会上,图灵奖得主、Meta首席AI科学家杨立昆在开幕式演讲上表示:“从长远来看,使AI平台安全、良善、实用的唯一方法是开源,AI技术被少数公司控制不是好事。”

开源大模型的推出,意味着无数开发者可以基于大模型来开发基础设施工具和应用,有望加速下游行业AI应用的开发效率、促进生态的蓬勃发展。同时,开源意味着更多的人可以审查它,识别并修复可能的问题,从而提升了安全性。当像Llama2这样的开源模型被广泛使用后,极有可能将冲击OpenAI等在生成式人工智能市场中建立的早期主导地位。

国盛证券也在一份报告中指出,开源有利于防止大公司垄断,破除商业禁用限制。开源大模型的蓬勃发展,有望弥合开放模型和封闭模型之间的质量差距,促进破除商业化禁用限制的目标。从算力视角来看,开源还有利于降低算力成本,使大模型的使用“普惠化”。

这也意味着Meta开源的野心不仅仅在于商业化变现,行行智能创始人李明顺今日评价,从长远来看,这有点类似于当年谷歌把安卓系统开源,意在构建一整套生态系统。

而在中国市场,也有一些大模型创业者选择了开源模式,例如王小川百川智能的baichuan-7B中英文大模型、智源的悟道3.0大模型系列以及面壁智能的CPM-Bee 10B中文基座大模型等。

智源研究院院长黄铁军此前对记者表示,应从基础设施的角度来看待大模型,将来智力可以作为通用的社会流通要素,人人都可以得到它,其价格也将类似于水电低成本的方式让全社会使用,这是放大人工智能能力的最佳方式。在他看来,开源开放正在成为塑造人工智能未来发展的主导力量,中国的开源经过30多年的发展,现在也进入到了蓄势发展的新阶段。

0000
评论列表
共(0)条