腾讯混元大模型姗姗来迟,高管解说有这几点考虑
虽然此前腾讯集团CEO马化腾表示不急于推出半成品大模型,但在这样的技术迭代节点,缺席不行。
9月7日,腾讯终于通过腾讯云对外开放通用大模型“腾讯混元”,由腾讯全链路自研,拥有超千亿参数规模,预训练语料超2万亿tokens。token是指一段文本的最小独立部分,大模型中,token可以是一个单词也可以是一个字符,一般会对token数量进行限制以避免超过模型的最大处理能力。
作为“混元”的领队,腾讯集团副总裁蒋杰2012年加入腾讯,2020年完成腾讯广告投放端整合。广告业务也是混元大模型的重要“试验地”,除此之外,云、游戏、金融科技、腾讯会议、腾讯文档等超过50项腾讯业务与产品均接入混元大模型测试。
相较于国内百度、阿里,以及人工智能创业公司在今年上半年的高调与迅速,腾讯在通用大模型领域称得上“缓慢”。除了马化腾所解释的“早一个月把电灯泡拿出来不那么重要”外,采访中腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,通用大模型对计算要求非常高,数据的积累也花费漫长时间,且行业大模型的发布能够满足具体客户的需求。
此次“延迟”亮相的通用大模型有哪些不同?蒋杰表示,腾讯混元重点关注中文创作能力,提高了模型在场景中的推理能力,让模型能够更好地抗拒“诱导”,并通过自研的“探真”技术来优化普遍存在的幻觉问题。
OpenAI研究人员此前撰文表示,“即使是最先进的人工智能模型也很容易产生谎言,它们在不确定的时刻往往表现出捏造事实的倾向。而这些幻觉在需要多步骤推理的领域尤其严重,因为一个逻辑错误就足以破坏一个更大的解决方案。”OpenAI采取奖励每个正确推理步骤取代奖励正确结果的方式来矫正幻觉问题。
腾讯通过探真(truth forest)等技术降低大模型的幻觉,而不是“背题”等单点优化的方式。蒋杰表示,外界会用到知识图谱甚至搜索外挂来提高大模型的检索支持能力,如有些开源模型厂商所发布的大模型中,搜索增强技术就占比10%甚至更多,但这会导致不一样的幻觉问题。腾讯也会用到这些增强技术,比例并不高,在预训练阶段优化目标函数,“彻底解决幻觉问题是非常非常难的,只能从概率上做到更低。”蒋杰成说。
腾讯选择全链路自研的路径主要是为了技术迭代更快,也可以和内部业务及应用有更深度的结合。此外,腾讯有海量高并发业务,开源架构的大模型不能够支撑腾讯的业务体量。
相较于其他大厂或创业公司提速开源的动作,腾讯混元目前所有能力均开放给腾讯业务部门,各业务基于混元的能力上去和更多的应用结合,把选择的主动权交给了集团业务部门。
优先结合自身应用的考量还包括了对大模型落地C端还是B端,蒋杰称,大模型在B端产生大规模商业收入这件事还有待探索,目前腾讯通用大模型在成熟度与对复杂任务的处理能力方面还不够,因此很多严肃专业场景还不到“解锁”的时候。另外大模型结合自身应用也可以在一定程度上抵消大模型研发高昂的设备、训练、人员成本。
目前腾讯拥有13.3亿微信(合并WeChat)月活用户数,1.15亿视频付费会员,1亿音乐付费会员,外界颇为关注这样大基数的产品叠加大模型技术后会发生什么改变。蒋杰对第一财经记者表示,腾讯产品和应用要提供什么能力和服务,以及什么时间发布,会由业务部门自己决定。
最终公布了通用大模型产品的腾讯杀入了战局。目前行业共识一方面AIGC是大趋势,另一方面大模型的能力边界与呈现形式到底如何并无定论,判断算力底座与大模型应用谁会是下一个技术时代的颠覆者也为时过早。
汤道生对第一财经记者表示,AI服务包括应用层、模型层、基础设施层。腾讯会持续投入云服务底座的角色,腾讯会将合适模型推荐给客户,应用场景也是如此。
如果以容错率和任务复杂度为坐标轴制作一个2x2矩阵,蒋杰表示,当前国内发布的大模型应用主要集中在容错率高、任务简单的休闲场景。而在更具价值的严肃场景、工作场景和专业场景,大面积的应用还无法胜任。
因此,蒋杰表示腾讯大模型会更关注将提效基础能力做好——不胡言乱语,更安全,可靠性更强,具备更好的逻辑思维能力等,这些才是最核心的。
上海市政府常务会议部署深化学习型城市建设,提升农村地区养老服务供给水平
让“喜欢学习、热爱学习、终身学习”成为主流。上海市委副书记、市长龚正今天(28日)主持召开市政府常务会议,要求按照市委部署,深化学习型城市建设;提升超大城市农村地区养老服务供给水平;推动空气质量持续改善。0000券商一季度“深蹲起跳”:九成营收净利双增长,部分小券商扭亏为盈
去年同期拖累业绩的自营业务,在今年一季度扛起营收大旗。超九成营收、净利润双双增长,24家净利润增幅在100%以上,上市券商一季度交出亮眼成绩单。据Wind,截至目前,44家已披露2023年一季报的上市券商,合计实现营收1377.02亿元,净利润449.99亿元。其中逾九成券商营收、净利润双双同比增加。锤子财富2023-05-03 20:14:330000龚正市长会见泰国国会上议院外事委员会主席,发扬光大“中泰一家亲”传统友谊
上海市市长龚正今天会见了泰国国会上议院外事委员会主席披坤凯一行。上海市市长龚正今天会见了泰国国会上议院外事委员会主席披坤凯一行。0000中央经济工作会议定下“积极”主基调,机构首席:A股有望进入盈利上行期
荀玉根认为,A股当下所处位置性价比具有较大吸引力,在“稳中求进”的要求下,2024年中国经济将延续复苏的趋势,A股也有望进入盈利上行周期。全面深化改革开放,推动高水平科技自立自强,加大宏观调控力度,统筹扩大内需和深化供给侧结构性改革,以及要强化宏观政策逆周期和跨周期调节,继续实施积极的财政政策和稳健的货币政策等……刚刚结束的中央经济工作会议,对2024年作出重要部署。0000图文│探营中央环保督察组:此轮督察重点关注哪些问题?
对于督察中发现的企业生态环境问题,既要督促有关企业切实履行生态环境保护责任,严格整改要求,确保整改到位;也要注重精细化管理,分类施策,加强指导帮扶。经党中央、国务院批准,第三轮第一批中央生态环境保护督察21日全面启动。锤子财富2023-11-25 23:39:090001