登陆注册
26788

前阿里云高管吴翰清再创业,如何解决大模型幻觉、打破数据垄断?

锤子财富2024-01-03 15:59:280
吴翰清认为,要让个人AI计算机补齐大模型和AI应用间“缺失的一环”。

在杭州EFC欧洲中心,一栋离阿里巴巴EFC园区步行五分钟的写字楼里,驻扎着许多年轻的创业公司,它们的创始人许多出自阿里巴巴。

科技行业刚刚走过了特殊的一年,大模型带来的“智能涌现”让许多人看到了人工智能的更多可能性。2023年年初,人工智能科学家、阿里副总裁贾扬清也宣布离职,投身AI创业,阿里之外,字节、腾讯、百度等大厂均有技术大牛出走创业,从对技术发展、应用的未来判断和预测中,他们寻找着机遇、创新以及其中的新商机。

吴翰清是其中备受瞩目的创业者之一,他的上一个身份是阿里云的道哥(花名),2005年加入阿里,是阿里巴巴集团的第二位安全工程师,创建了阿里巴巴、淘宝、支付宝的安全体系,也是阿里云的初创团队成员。2023年5月,他从阿里云离开,联合另两位创始人以及 13 名初创团队创立了一家人工智能公司KMind。他们选择了“个人AI计算机”,要让个人AI计算机补齐大模型和AI应用间“缺失的一环”。

科技行业在大模型赛道“狂飙”的一年过去了,在接受第一财经采访时,吴翰清谈到了他所观察到的AI产业现阶段存在的问题,对数据收益被大公司垄断的不认可,以及在AI、云计算发展新阶段下,个人AI计算机诞生、发展的可能性。

“普通人对AI失去信心”

“很多企业非常期待大模型的能力。但是他们真正投入之后,会发现只能用来打一个样板房做一个宣传,没办法去切入到实际的生产流程里面去创造实用价值。”谈到ChatGPT发布以来这一年行业的状态,吴翰清看到了许多问题。

2023年7月,KMind推出了一款面向C端的AIGC 效率工具“魁星智能助手”,受到市场欢迎,吴翰清打开手机企业微信向记者证明:推出3个月时,该应用已有了10万用户。“但最后发现用户流失率非常高。”他坦诚道出了产品后来的困境。

难以解决的,一个是大模型幻觉的问题,当用户提出一些请求时,大模型有时会给出一些与事实不符的回答,甚至胡编乱造的错误回答,给应用带来了问题。

另一个是AIGC产品缺乏精确控制的问题。“比如像我妈这种完全不懂什么叫AI的普通用户,她喜欢天天拍照做相册,我跟她说可以用AIGC产品来做,自动化生成一个相册。她做完之后想配个背景音乐,然后她跟AI说你把这个背景音乐给换成《茉莉花》,然后AI就蒙圈了。”吴翰清进一步阐释:“这个时候你就会发现普通人就会对AI失去信心,因为他真的是把它当成一个人在对待,这些问题的出现导致今天我们从应用角度来说,大模型缺乏所谓的最后一公里,它离真正创造实用价值是有距离的。”

《2023—2024年中国人工智能计算力发展评估报告》显示,截至2023年10月,中国已累计发布两百余个大模型。与之相关的AIGC应用更是不计其数。但大模型幻觉、缺乏精确控制与实际应用场景,仍是这个行业普遍存在的问题。

“举个典型例子,大家都在谈AIGC,但我一直跟团队说不要提AIGC这个概念,它完全把事情说歪了或者说小了。什么叫AIGC?那一定是创造,就是文生图、文生文、文生短视频,这是大家非常熟悉的。但我们知道(实际应用中)修改的需求是比生成的需求要大10倍以上的,那谁在做修改呢?没有人在做修改。”吴翰清观察到,目前所有的大模型产品无论哪种类型,都只能生成第一遍结果,当用户试图去修改时,大模型只会重新生成一遍,再生成的基本要素全部变掉,由于这些问题的存在,用户很难真正用AIGC应用去解决问题。

回答“《西游记》里有几个孙悟空”

“这些问题促使我们思考,到底应该怎样回到一个正确的轨道上、去坚持做正确的事情。”AIGC热闹浪潮下,吴翰清带着许多问题和思考离开阿里云开始了再创业,“一定要解决一个别人都解决不了的问题,然后才能证明这件事情是有必要的。”

吴翰清将AIGC的许多问题归因于产业链中间环节的缺失。他认为大模型是CPU,而无论是ToB还是ToC的AI应用,都需要一个中间环节来将其与大模型联系起来,不可能指望应用直接跑在CPU上。而在他的蓝图里,个人AI计算机的创造或发明,将是在AI技术变革中使产业链完整、真正让大模型成为CPU支撑所有AI应用创造实用价值的一种解法。

(受访者供图,图中为吴翰清)

“在Web端时代,比尔盖茨基于个人计算机推出了Windows的操作系统,提出了软件的概念。在移动端时代,苹果发明了智能手机,并在2008年推出了APP Store,然后才有了APP概念。”吴翰清谈到了那些科技界过往跨时代意义的发明,在他来看,来到AI互联网时代,人们也需要个人计算机及AI时代新的程序开发形态来定义、修正、约束AI的动作,AI的能力、行为和性格也将在未来具备可塑性和成长性,他将这种个人AI计算机上的新的算法程序定义为“ACT”。在KMind 推出的个人AI计算机的架构kOS里,程序员可以开发自定义的“ACT”,用于定义AI的某种自主行为。在未来,当AI成熟到可使用某种形式化语言来自动编程时,普通用户也可以实现使用自然语言和个人AI计算机交互。

基于此,2023年7月,KMind 正式发布了自己的品牌和产品:半个宇宙(hikOS),希望提供一个由kOS驱动的个人AI计算机给所有普通用户使用,目前,KMind已推出了由kOS驱动的个人智能助理“星伴”,吴翰清介绍,与大部分公司推出的“可调用”的AI不同,星伴具备的可编程的能力,人们可以通过编写ACT来定义星伴的能力和行为,而星伴的个性化知识、经验、记忆、性格将被保存在“星魂”,将成为未来用户宝贵的数字资产。

“可编程”的AI在吴翰清的创业理念中显得尤为重要,在他的讲述中,kOS尝试在统一神经网络和高级编程语言这两者,或者说从更高的层面来说,尝试着用同一个系统来统一掉连接主义和符号主义,让它兼具神经网络的泛化能力,同时又能够保留高级编程语言的逻辑推理能力,也就是精确控制能力。

这同样可以回到大模型幻觉和缺乏精确控制能力的问题思考上。“《西游记》里面有几个孙悟空?”吴翰清抛出了这个问题。据吴翰清观察,《西游记》里提及了几次“孙悟空”是目前市面上所有大模型都无法回答的问题,他有时是“大圣”,有时是“孙行者”,还有时是代词“你我他”,大模型无法计算,时常会给出胡言乱语的答案。但对传统的程序员来说,这压根不是一个问题,当他用编程、逻辑推理去解决时,这个问题很容易得到确定答案。

“工业界的人被学界给带歪了,学术界的人一直在追求让神经网络具备逻辑推理能力,而工业界应该把AIGC当作一个应用问题投入到生产以及扩大规模。”吴翰清表示,通过kOS对神经网络和高级编程语言两者的统一和模拟人的思考过程的符合控制的设计思想,以及通过数据的脱水和数据的浸泡产出结构化数据的符合信息论的思想,未来,kOS能够更好地解决大模型的幻觉和精度问题。

如何避免“数据垄断”

“数据垄断”的问题同样是吴翰清对互联网现状的重要观察之一。

他认为,当今互联网最深层次的主要矛盾在于:“信息聚集导致的数据垄断”和“人们对自由、开放、 共享、 平等的网络环境的向往”之间的矛盾。他在个人公众平台写道:互联网带来便利的信息访问,但也导致了信息在某些超级节点(如大型互联网公司)的聚集,进而形成了数据垄断。这种模式导致了广告商业模式的出现,使得大型互联网公司通过垄断数据实现盈利。

在他看来,数据垄断的弊端在于用户贡献了数据,收益却被大公司垄断,这造成了数据税的问题,抬高了商品售价。同时,数据垄断也带来了互联网的割裂,使得互联网变得地盘化,降低了用户效率和体验。垄断还瓦解了互联网的自由属性,使得小的个体难以在互联网上出头,而大型公司则失去进取动力,导致腐朽。

在推动技术进步的同时,做一家避免数据垄断、“不作恶”的公司成为吴翰清和KMind的目标之一。“所有的大模型都在走OpenAI的道路,但我们没有尝试着去走,这里面有一个很重要的区别,如果这个公司的商业模式是广告,很难避免自己不作恶。”

吴翰清认为,数据垄断的矛盾首先可以通过调节网络结构来制衡资本的无序扩张。将互联网设计成一个类似于人类社会关系网络的模型, 构建一个更加公平的、去中心化的,局域化的网络,再通过长程连接把各个局域连接起来,避免了信息超级节点的出现。同时通过新型技术架构改变互联网的信息流动方向,从而消除信息聚集。

个人AI计算机可能成为未来数据技术革命的一部分,同时,吴翰清强调,KMind在成立之初就宣布会将“半个宇宙”里信息的推荐和检索算法开源,由一个开源社区来维护,“如果有一天半个宇宙居然想要把这些闭源掉,那我也号召所有半个宇宙的居民来推翻它,因为从那一天可能就是它作恶的开始,它又开始从尝试不垄断数据走向了数据垄断。”吴翰清承诺,未来用户数据会放在“半个宇宙”的世界里,但KMind不会通过用户的数据训练自己的模型,也不会基于做一个拥有所有常识的AI出来,然后去收费。

这也指向了未来大模型和AIGC商业化的另一条路径。吴翰清表示,目前大部分大模型都尝试通过大模型拥有的无比巨大的知识和常识来收费,要么直接收费,要么通过广告收费,但KMind要卖的是算力。“半个宇宙”提供的是算力,程序员进来提供的是算法,用户提供的数据,所以数据是归用户的。用户得到了数据,创造了价值,程序员得到了他写的算法创造的价值,半个宇宙得到提供算力的价值。

在AI互联网时代的浪潮滚滚而来时,“一个非常良好的产业分工”是被吴翰清所期待和强调的。在AI技术革命及其可能带来的商业狂欢里,吴翰清警惕着数据垄断与“赢家通吃”,“我们相信技术可能给人带来幸福。”他说。

0000
评论列表
共(0)条