首页新闻对话港大罗晔：人工智能领域存在三个“脱节”，OpenAI是一个“不完美的答案”

对话港大罗晔：人工智能领域存在三个“脱节”，OpenAI是一个“不完美的答案”

锤子财富2023-12-29 21:48:470阅

就像早期的炼金和化学一样，炼金术士很早就研究出了很多很复杂的化合物，但化学家还停留在连基本的化学反应都搞不懂的状态。

AI无疑是2023年科技界最热闹、投资界最关注领域之一。从年初的ChatGPT快速迭代，到年尾的OpenAI“内斗大戏”，人工智能无论是在科学创新还是组织管理层面，都在以大幅领先理论研究的节奏快速前进。

“人们往往高估人工智能在短期的进展，但低估人工智能在长期的进步。”香港大学经管学院副教授、数字经济与创新研究所副所长罗晔研究人工智能接近十年，在他看来，过去十年人工智能在工业界的进步远远超出预期。包括大语言模型，到来的时间也比预想的要快得多。

然而，工业界的快速发展也带来很多新的课题。在罗晔看来，这背后有三个“脱节”需要解决。一是应用和理论的脱节，二是工业界与学术界的脱节，三是整个人工智能领域与其他社会领域之间的脱节。

作为AI科学家和经济学家，罗晔不仅关注人工智能在科学创新领域的进展，也关注新的组织形式带来的管理学问题和权力再分配问题。近日，第一财经记者就人工智能领域的前沿问题以及OpenAI引发的巨大争议与罗晔进行了一场深度对话。在他看来，OpenAI“内斗”风波是一个巨大的警示——权力越来越向少数人手中集中，而传统公司治理理论与实践经验已经不足以面对一个管理“天才”的组织。

人工智能领域存在三个“脱节”

第一财经：回顾人工智能这一年，你认为取得了什么颠覆性的进展？

罗晔：ChatGPT的推出对整个行业确实有颠覆性影响。但是人们往往高估人工智能在短期的进展，低估人工智能在长期的进步。

我研究人工智能接近十年时间。过去十年，人工智能在工业界的进步远远超过我的估计。我一开始觉得，很多问题在数学原理和机器学习理论上是一个非常难的问题，可能十年之内都做不出来，但他们往往两三年内就做出来了。

我最早从2017年开始跟踪Transformer类模型，早期的技术比较粗糙，当时我认为十年之内都不可能有真正意义上的应用。但是到现在也就才五六年就取得重大突破，比如Deepmind所研究的稀疏强化学习问题等。所以实际上工业界的进展总是以比我预想的至少快一倍的速度在前进。当然，道路的前方依然有着若干难以逾越的如逻辑推理一类的技术难题，它们是否能够快速得到解决还有待观察。

从长期来看我们似乎总是在低估人工智能的进步和发展，但是短期来看ChatGPT每一代比上一代技术有什么区别，从技术原理上并没有真正的变化。但也需要注意到，这种模型在应用层面突破了一个临界点。

第一财经：什么临界点？

罗晔：以前所有做自然语言处理问题时，我们面临的都是非常繁复的工程问题。随着大语言模型的出现，现在可以用同一个底座处理所有的问题，这就解决了应用层面很大的一个挑战。

GPT模型本质上是一种编译器。它的输入是数据和自然语言编写成的“代码”，也就是所谓的Prompt(提示词)。只不过它输出的内容精确度还不够高，很多时候南辕北辙，或者胡编乱造。但无论如何，它都使得编程过程极大地简化。使用ChatGPT作为一个编译器来开发各种各样的应用非常有前景，很多场景下投入的资源、人力、时间，可能是传统编程方式的十分之一，并且效果可能更好。而且由于这个底座的产生，应用层面的进展将会有巨大突破。假设未来人工智能技术不再向前发展，现有的技术和潜在应用也足以在各个工业领域掀起巨大的变革浪潮。

第一财经：你反复提到应用层面的进展每次都超出你的预期。你是否思考过，为什么自己总是低估工业界的速度？

罗晔：这是一个非常好的问题。这是因为当前人工智能的发展存在几个脱节。

第一是应用和理论的脱节。应用层面，无论AlphaGo还是ChatGPT，都是经验性的应用，还没有完备的理论指导，经验远远领先于理论。当我们对很多原理还不理解的时候，工业界在应用层面却走得很快，通过摸索式的方式实现了很多突破。就像早期的炼金和化学一样，炼金术士很早就研究出了很多很复杂的化合物，但化学家还停留在连基本的化学反应都搞不懂的状态。

这也让我怀疑并且持有一种保守的态度，在没有重大数学、统计学、机器学习理论革新的情况下，这种实验层面的飞速发展是否能够持续。

第一财经：摸索式的方式产生经验性的应用，这就是靠“运气”？

罗晔：不完全是，很可能是工业界把握了某些优化领域的洞察，只是为什么是这样的，我们还不能完全理解。有不少机器学习理论专家在进行这方面的研究和探索，但是到目前还没有完全能够令人信服的、完整的数学理论取得基础性的进步。

第一财经：我们能理解么？

罗晔：这也是一个很好的问题。至少从目前来看，并不容易。

人的认知能力也是很有限的。对于这些大语言模型为什么能够有效，对深度学习领域为什么注意力模型效果比较好，以实验为主的科学家有他们的解释，但是他们的解释缺少基础理论支撑，显得非常空洞。很难看到像爱因斯坦、牛顿这样的科学家出来，把底层机制完全揭示清楚。目前应用数学对深度学习的描述能力也还相对有限。在实践过程当中，经验占据了主要的指导意义，所以对实战经验的积累在做好GPT应用中非常重要。

第一财经：还有哪些“脱节”？

罗晔：第二个脱节，是工业界与学术界的脱节。工业界具有算力多，资源多、问题多、数据多的优势，并且能够看到比较直接的经济效益，所以很多科学家活跃在工业界，最好的人工智能科学家之中相当多数都从学术界跳槽到工业界。高校由于资源有限，能做的事也相对有限。

第三个脱节，是整个人工智能领域与其他社会领域之间的脱节。参照IT来说，以前大家对IT行业兴起时有过一个比喻，经济学上叫“泛化效应”。就是更早接触到IT技术的行业，受IT影响导致生产力的提高，速度比更晚接触到的要快。所以会看到，金融业就是受IT影响比较早、比较大的行业，而农业就比较晚、比较慢。

行业的脱节，必然造成财富分配的问题，因为生产力越高财富聚集速度越快，所以该行业的从业人员相对来说工资更高，财富积累速度更快。过去三十年大家对美国劳动力经济学的研究就发现，新增高薪岗位主要以IT和金融业为主，传统行业都被抛到后面去了，甚至很多工作都被转移到中国、越南等地。未来，人工智能技术的兴起是否也会再一次影响到整个社会的财富再分配，也是一个需要正视的问题。

第一财经：这还需要问“是否”？答案难道不是“一定会”？

罗晔：不一定，这需要看监管者如何设计再分配机制。实际上这也是OpenAI内斗风波的一个深层原因。

任何一个领域，政府的监督或多或少都是有必要的，在人工智能这个领域可能更是如此。尽管有观点认为，科学家应该有自由度去做他们想做的事情。确实，科学创新应该有自由，但是科学创新的结果和导致的各种后果，是需要监督的。

可以看一个例子。1960年代，通用汽车公司有100万员工，当时美国国会议员曾宣称，只要对通用汽车好的就是对美国好的。1970年代看IBM，IBM有5~10万员工，是当时全世界最有影响力的公司之一，对美国国会的影响力也非常大。IBM之后是微软，大概有1万~2万员工，微软之后是脸书，总部只有3000名员工，到今天OpenAI核心人员在ChatGPT发布之前大概只有六七十人左右。可以看到，全世界影响力最大的企业组织人数在急剧减少，这本质上意味着权力在向更少的人手里集中。当大家都在探讨人工智能的商业价值以及对财富带来的重新分配时，我们也必须关注它带来的权力的重新分配。这种由技术进步带来的权力再平衡可能对全世界产生深远影响。

从OpenAI内斗风波来看，传统的公司治理制度是否还适用于人工智能这种智力集中型行业中的企业，是一个问题。

OpenAI是“不完美的答案”

第一财经：科技公司的公司治理已经越来越成为一个问题。如果传统的架构已经无法发挥作用，我们用什么来代替？

罗晔：显然我们需要新的治理架构，但具体是什么，即便在全世界研究公司架构和治理的理论体系内，我们并没有完整答案。

从最小的“原子”，一个人工智能企业或者组织内部来看，存在一种明显的对立。比如OpenAI的首席科学家是伊尔亚·苏茨克维（Ilya Sutskever），有人说在OpenAI伊尔亚是1，其他人全是0，如果没有他，其他都没有意义。传统的公司都是技术人员服从管理层的决定，但在OpenAI似乎并不如此。

资本会担心被伊尔亚抛弃，但对伊尔亚而言，他面临的选择显然比资本更多。尽管山姆·奥特曼（Sam Altman）已经回到OpenAI，但可以确定的是，现在只是一个暂时状态，真正的问题并没有解决。

第一财经：真正的问题是什么？

罗晔：真正的问题就是该如何管理“天才”。

传统公司治理理论并没有涉及如何管理天才。我们倾向于认为，天才的管理是很困难的。

比如看NBA比赛，火箭队总经理莫雷以数据化管理著称。数据化管理是有效的，有很高的概率可以将球队带到季后赛，但是很难成为总冠军。如果去生产冠军，是很困难的事情。冠军很难被公式化，批量化制造出来，冠军气质也很难用常规管理学理论去解释；这也是为什么在各种体育赛事中，冠军教头，冠军球员往往在收入上相比起一流教头，一流球员有着一个很大的优势的原因。

天才不喜欢被管理，他所从事的工作具有三个典型特征：资源和时间的消耗高度不确定，结果高度不确定，过程高度不确定而且不可监督。他可能99天都躺在海滩晒太阳，但最后一天把世界难题解决了。对于顶尖的人工智能组织，传统的商业激励、股权激励可能都很难有效，而KPI管理体系更是会劣币驱逐良币，将真正的天才淘汰出局。

第一财经：你抛出了一个问题，但我们希望听到一个答案。

罗晔：我们曾经思考过这个问题，我们有一些进展，但目前没有完整答案。这在全世界范围内都是很难的一个问题。

其实可以反过来想，OpenAI是一个问题，但也可能是一个答案。只是它的答案并不完美，所以暴露了一些值得我们从管理学和经济学方面去思考的问题。

OpenAI之所以能够成功，其原因之一恰恰是因为他跟很多传统企业的管理模式是不一样的。OpenAI是一个非盈利机构，最初拿到一笔初始资金，然后汇集了一帮理想主义的科学家，既没有定义要做什么，也没有定义要赚多少钱，只是让这些人去做研究，研究一个虚无缥缈的终极命题：如何去规范人工智能。这是人类历史上少有的，科学家拥有如此多的资源同时拥有如此多的自主权。

在微软、谷歌以及中国头部的科技企业，其实都有自己的研究院和自己顶尖的科学家。但是他们依然要受制于董事会，受制于公司业务，很多时候要服务于公司业务需求。

OpenAI则是一个完全不需要为业务服务的组织。如果在一个以盈利为目的的公司说，要做一个大语言模型，要投资10亿美金，而且很可能毫无产出或者在竞争中失败，这种提案大概率会被董事会毙掉，或者CEO就会直接毙掉了。

第一财经：OpenAI不仅让我们看到人工智能理论和应用的脱节，也显示出管理学领域理论与应用的脱节。OpenAI本身就是一场管理学实验。

罗晔：是的，OpenAI不仅在技术上走在前沿，给我们提供了很多观察的契机，它在公司治理、组织管理上，也给了我们一个巨大警示。

对于一种可能改变世界的技术，我们一方面希望科学家拥有巨大的热情和空间去做尝试，另一方面又希望限制科学创新导致的不平等的影响，同时又要平衡资本与科学家的兴趣，这在管理上是一个巨大的挑战。

我并不认为现在我们在管理学、经济学里有任何彻底的解决方案，我们甚至连正式的研讨会都没有。整个管理学对于如何管理天才，对于如何平衡颠覆式创新的效率和风险之间，还是一个空白。

每个领域都有终极问题，终极问题带来终极理想。天才往往会思考非常本源的问题，甚至会改变传统对本源问题的看法。虽然有人认为他们是偏执狂，但我认为，他们都是非常值得尊敬的，因为追求终极理想本身就需要特别大的勇气。

GPT-for-Finance“理论上完全可行”

第一财经：金融是高度依赖数据的领域，也是人工智能重要的应用领域。我们知道，香港大学团队目前正通过结合生成式AI、金融学领域知识，以及金融通用求解器，建立以自然语言为基础的金融领域深度工业级自动化决策平台——GPT-For-Finance.

GPT在金融领域的发展到了哪个阶段？取得的核心突破是什么？面临的最大挑战是什么？有观点认为金融GPT还面临很多困难，比如上市公司很多报告都是表格和图，大语言模型该如何处理这些数据？

罗晔：彭博最早开发了专门使用金融计算的BloombergGPT，不过更多的金融领域的应用是偏向于一个问答助手。我们在尝试推动的是决策，而不是问答辅助，我们试图去构建在金融机构生产流程中能够替代一部分生产的工具。

基于有限的资源，我们主要在相对核心的金融学问题上进行尝试。目前取得的核心突破是，在某一些问题上已经从原理上验证是可行的，比如金融某些领域中的报告撰写。我们的模型已经可以把研报当中的某一些章节生成到相对专业的水平。

表格和图片也是完全可以处理并且可以生成的，不过不是用大语言模型的多模态来做，很多工作依然是用传统方式来处理，使用AI-工具的方式集成到大语言模型的核心上。金融领域的有相对规范化的数据，比如财务报表，只要针对想要获取的数据设计提示词，再结合合适的数据去提取即可。涉及到计算的，可以设计专门的模块去完成，这样可以提高整体的精准度，并且更快地获得计算结果。

模型的精确度是非常重要的。我们做了大量工作来提高精确度。比如，把生产流程分成很多小步骤，然后区别哪些环节大语言模型最适合做，层层拆解之后，精确度就可以大幅提升。这种任务拆解之后进行传统机器编程和提示词工程的方法统称为自然语言编程。这种方法的特性是没有通用的解决方案，而是因每个应用而不同。

用这种方式有很大希望可以做到行业内可以实用的状态。在决策的流程方面，实验表明是完全可行的。不过最大的挑战是我们资源有限，所以后续很多工程问题还需要业界来完成。

第一财经：金融领域哪些部分会率先被替代？

罗晔：可能是替代，也可能是增强。更可能的方式是人工智能先做一部分工作，再由人来做一些加工。

比如行业分析师、量化分析师的部分工作。很多分析师做的工作在程序上市高度重复的，比如提取数据、分析数据等，这类工作使用标准化的AI-agent就可以实现。在策略优化阶段，也可以探讨用AI-agent来完成。

金融很大程度上是一个概率游戏。比如银行，并不关注几百，几千万笔贷款中具体哪一笔贷款有风险，更关注整体的不良率。人工智能在这样的领域也有很大的应用空间。

而无论是银行、保险还是投资领域，人工智能不仅可以发挥服务客户的功能，也可以在工作流程上进行比较大的更改，这对金融行业的运转或许会产生很大影响。