大模型书生·浦语再开源,推出200亿参数版本
9月20日,上海人工智能实验室宣布与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。同时,书生·浦语面向大模型研发与应用的全链条工具链升级,与InternLM-20B一同继续全面开放,向企业和开发者提供免费商用授权。

上海人工智能实验室是人工智能领域的新型科研机构,主要开展战略性、原创性、前瞻性的科学研究与技术攻关。在大模型的应用价值日趋受到关注的背景下,上海人工智能实验室联合多家机构推出中量级参数的 InternLM-20B 大模型,其重点在于性能先进且应用便捷,以不足三分之一的参数量,达到了当前被视为开源模型标杆的Llama2-70B的能力水平。
自今年6月首次发布以来,书生·浦语已历多轮升级,此次其发布的20B量级模型具备更为强大的综合能力,在复杂推理和反思能力上尤为突出,因此可为实际应用带来更有力的性能支持;同时,20B量级模型可在单卡上进行推理,经过低比特量化后,可运行在单块消费级GPU上,因而在实际应用中更为便捷。
在相对有限的参数规模下,研究人员在架构设计时面临重要的取舍——提高模型的深度还是宽度?通过广泛的对照实验,书生·浦语团队发现,更深的模型层数更有利于复杂推理能力的培养。因此在架构设计时,研究人员把模型层数设定为60层,而7B与13B模型通常采用32层或者40层设计;同时内部维度保持在5120,处于适中水平。通过架构设计上的新取舍,InternLM-20B在较高计算效率的条件下实现了复杂推理能力的显著提升。
相比于此前的开源模型,InternLM-20B的能力优势主要体现在更长的语境。通过外推技术,InternLM-20B支持16K语境长度,可以支持长文理解、长文生成和超长对话。
工具调用是拓展大语言模型能力边界的重要手段,也是OpenAI近期推出大模型的重点特性之一。InternLM-20B对话模型支持了日期、天气、旅行、体育等数十个方向的内容输出及上万个不同的 API。
厄尔尼诺引发非洲南部干旱,虽已减弱,会否影响全球粮食贸易?|气变与大宗
WMO判断,厄尔尼诺正在逐渐减弱,但在未来几个月将继续影响全球气候。厄尔尼诺现象引发的横跨非洲南部大片地区的严重干旱正在全球粮食贸易中激起涟漪。受厄尔尼诺现象影响,非洲南部多个国家遭受严重旱灾,粮食生产受到较大冲击,津巴布韦、马拉维、赞比亚等国已宣布进入紧急或灾难状态。目前,这些国家正在转向其他生产国来填补缺口。譬如,津巴布韦的玉米产量可能锐减约60%,该国正在考虑十年来首次从巴西进口玉米。锤子财富2024-04-29 02:00:170001浙商证券股权收购新动作,拟受让国都证券约19%股份
12月8日晚,浙商证券公告称,公司拟受让国都证券股份,相关事项尚处于初步筹划阶段,交易方案仍需进一步论证和协商。继年初竞拍民生证券股份失败后,浙商证券股权收购又有新动作。0000李强会见美国特斯拉公司首席执行官
中国的超大规模市场将始终向外资企业敞开。中方言出必行,将在扩大市场准入、强化服务保障等方面继续下功夫,为外资企业提供更优的营商环境、更有力的综合支持,让各国企业安心、放心地投资中国。国务院总理李强28日在京会见美国特斯拉公司首席执行官马斯克。0000最高法发布意见 依法保护民营企业产权和企业家合法权益
最高人民法院今天发布《最高人民法院关于优化法治环境促进民营经济发展壮大的指导意见》,对相关审判执行工作提出了明确要求。如何依法保护民营企业产权和企业家合法权益、维护统一公平诚信的市场竞争环境,最高人民法院今天发布《最高人民法院关于优化法治环境促进民营经济发展壮大的指导意见》,对相关审判执行工作提出了明确要求。000082家科创板公司超7成业绩预喜,新能源行业领跑
业绩增长及预喜公司占比超过7成,合计归母净利润同比增幅约75%。进入业绩报告披露季,今年上半年科创板公司的业绩情况逐步揭晓。截至2023年7月31日晚,科创板已有82家公司披露2023年半年度业绩情况,其中13家公司发布2023年半年度报告,65家公司发布业绩预告,4家公司发布业绩快报。0000