大模型书生·浦语再开源,推出200亿参数版本
9月20日,上海人工智能实验室宣布与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。同时,书生·浦语面向大模型研发与应用的全链条工具链升级,与InternLM-20B一同继续全面开放,向企业和开发者提供免费商用授权。
上海人工智能实验室是人工智能领域的新型科研机构,主要开展战略性、原创性、前瞻性的科学研究与技术攻关。在大模型的应用价值日趋受到关注的背景下,上海人工智能实验室联合多家机构推出中量级参数的 InternLM-20B 大模型,其重点在于性能先进且应用便捷,以不足三分之一的参数量,达到了当前被视为开源模型标杆的Llama2-70B的能力水平。
自今年6月首次发布以来,书生·浦语已历多轮升级,此次其发布的20B量级模型具备更为强大的综合能力,在复杂推理和反思能力上尤为突出,因此可为实际应用带来更有力的性能支持;同时,20B量级模型可在单卡上进行推理,经过低比特量化后,可运行在单块消费级GPU上,因而在实际应用中更为便捷。
在相对有限的参数规模下,研究人员在架构设计时面临重要的取舍——提高模型的深度还是宽度?通过广泛的对照实验,书生·浦语团队发现,更深的模型层数更有利于复杂推理能力的培养。因此在架构设计时,研究人员把模型层数设定为60层,而7B与13B模型通常采用32层或者40层设计;同时内部维度保持在5120,处于适中水平。通过架构设计上的新取舍,InternLM-20B在较高计算效率的条件下实现了复杂推理能力的显著提升。
相比于此前的开源模型,InternLM-20B的能力优势主要体现在更长的语境。通过外推技术,InternLM-20B支持16K语境长度,可以支持长文理解、长文生成和超长对话。
工具调用是拓展大语言模型能力边界的重要手段,也是OpenAI近期推出大模型的重点特性之一。InternLM-20B对话模型支持了日期、天气、旅行、体育等数十个方向的内容输出及上万个不同的 API。
新冠和流感可能“交替流行”,联合疫苗接种有必要吗
近期研究发现,新冠大流行期间人群对于流感的预存免疫力较之前有明显下降,人群易感性增加。随着新冠疫情防控政策放宽后,我国流感负担可能大幅增加。今夏,南方地区的流感会和奥密克戎XBB引起的第二波新冠疫情形成共流行趋势吗?自2022年5月以来,我国南方省份流感活动再次呈持续升高趋势,进入夏季高发期,达到近5年同期最高水平,以A(H3N2)亚型为绝对优势株。0000在构建新发展格局中,不断推进高水平对外开放
我国正在形成以创新为重要特征的产业生态系统竞争新优势,从原材料获取、生产制造、研发、运输物流,到维修、知识产权、金融、标准制订等产业链所有环节,都具备了创新能力。2023年是我国改革开放45周年。经过45年改革开放发展,我国取得举世瞩目的成就。站在改革开放的新起点上,未来要以国内大循环为底盘,深化国别合作,促进国际循环,不断提升我国对外开放水平。站在新起点上推进高水平对外开放0000金融监管部门“一把手”齐发声,陆家嘴论坛传递了哪些信号
“一行、一局、一会”的“一把手”在同一日发声,谈及了再保险国际板、监管体制改革、中国特色现代资本市场发展之路、人民币汇率、碳中和等话题。6月8日上午,第十四届陆家嘴论坛在上海开幕,本届论坛的主题为“全球金融开放与合作:引导经济复苏的新动力”。0000国家级都市圈增至14个,已有两个GDP突破5万亿
2023年,国家级都市圈快速扩容。根据各地官方发布消息,一年之内,沈阳、杭州、郑州、广州、深圳、青岛和济南等7个都市圈获批。国家级都市圈在2023年快速扩容,一年增加了7个,相当于前两年批复的总和;而且都市圈的经济总量也在扩张,两个都市圈地区生产总值去年已经突破5万亿元。锤子财富2024-02-25 22:19:100000全国一体化算力算网调度平台正式发布
该平台汇聚通用算力、智能算力、高性能算力、边缘算力等多元算力资源,针对通用、智算、超算等不同客户的不同需求,设计异构资源池调度引擎,实现不同厂商的异构资源池的算力动态感知与作业智能分发调度。0000