全面赶超GPT-4 ？阿里云发布通义千问2.5

锤子财富2024-05-11 11:48:120阅

阿里云表示，与GPT-4相比，中文语境下，通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。

5月9日，阿里云正式发布通义千问2.5。阿里云方面表示，该模型性能全面赶超GPT-4Turbo。

阿里云表示，与通义千问2.1版本相比，通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%；与GPT-4相比，中文语境下，通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4。随着通义千问2.5的发布，阿里云表示，在权威基准OpenCompass上，通义千问2.5得分追平GPT-4Turbo，是国产大模型首次在该基准取得该项成绩。

“对标”GPT-4正在成为国产大模型的潮流。今年4月，商汤科技宣布发布全新升级的日日新SenseNova5.0大模型——采用MOE混合专家架构，基于超过10TB tokens训练，推理上下文窗口200K，商汤科技董事长兼首席执行官徐立表示日日新5.0大模型体系综合能力全面对标GPT-4，知识、数学、推理和代码能力方面大幅提升。

加速技术追赶的同时，国产大模型也在不断推进行业落地。阿里云公布的数据显示，目前，通义大模型已通过阿里云服务企业超9万、通过钉钉服务企业超过220万，通义开源模型累计下载量突破700万。通义落地应用进程加速，现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

此外，阿里云还在今日发布了最新款开源模型1100亿参数的Qwen1.5-110B，阿里云表示，该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型；HuggingFace推出的开源大模型排行榜OpenLLMLeaderboard上，Qwen1.5-110B位列榜首。阿里云表示，海内外大量中小企业和开发者以下载开源模型的方式使用通义，在HuggingFace、魔搭ModelScope等开源社区，通义开源大模型的累计下载量超过了700万。

同时，阿里云通义灵码也正式宣布推出企业版。通义灵码是阿里云推出的一款智能编码助手，基于SOTA水准的通义千问代码模型CodeQwen1.5研发，阿里云表示，2023年10月发布至今，通义灵码的插件下载量已超350万，每日推荐代码超3000万次，被开发者采纳的代码超亿行。随着企业版的推出，通义灵码将满足企业用户的定制化需求。

5月9日上午，通义千问2.5发布后，阿里巴巴港股盘中略有上涨，截至发稿，阿里巴巴港股报价76.65港元，今日开盘价为75.75港元。

全面赶超GPT4 阿里云发布通义千问25

0000

评论列表

共(0)条

相关推荐

国资委：将以抓好巡视整改推进国资央企高质量发展
压紧压实责任，在抓好自身整改工作基础上，加强对中央企业巡视整改的督促指导。
锤子财富新闻2024-06-08 04:21:11
0000
商务部新闻发言人就无人机出口管制政策应询答记者问
高性能无人机具有一定军用属性，对其实施出口管制是国际惯例。问：7月31日，商务部、海关总署、国家国防科工局、中央军委装备发展部联合发布了关于无人机出口管制的两个公告。请问中方此次出台对无人机出口管制政策，有什么考虑？
锤子财富新闻2023-07-31 18:42:02
0000
晚间公告丨4月20日这些公告有看头
4月20日晚间，沪深两市多家上市公司发布公告，以下是第一财经对一些重要公告的汇总，供投资者参考。【品大事】扬杰科技：拟10亿元投建6英寸碳化硅晶圆生产线项目
锤子财富新闻2023-04-20 18:50:51
0000
新闻
产业开始铺垫6G 大范围卫星通信能否实现？
即便5G现在遇到难题，也不意味着6G就不推进了，行业会继续寻找新的应用。5G商用还在扩展，6G已在布局。“今年11月ITU（国际电信联盟）将在迪拜开一个世界无线电大会，开启新一轮6G频率研究，很多产业和政府背后的工作已经在往前推进。”博鳌亚洲论坛国际科技与创新论坛第三届大会上，GSMA（全球移动通信系统协会）大中华区公共政策总经理关舟表示。
锤子财富2023-09-20 18:46:25
0000
新闻
力拓集团与进博会签下未来“五年之约”
在过去5年间，进博会展现了中国主动向世界开放市场的决心，并成为中国共享发展机遇、推动全球合作的重要平台。5月22日，力拓集团与中国国际进口博览局签订了2024-2028年长期参展合作备忘录，成为首家签约未来5年进博会的世界500强企业。
锤子财富2023-05-23 12:15:13
0000