大模型书生·浦语再开源,推出200亿参数版本
9月20日,上海人工智能实验室宣布与商汤科技联合香港中文大学和复旦大学正式推出书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区(ModelScope)开源首发。同时,书生·浦语面向大模型研发与应用的全链条工具链升级,与InternLM-20B一同继续全面开放,向企业和开发者提供免费商用授权。
上海人工智能实验室是人工智能领域的新型科研机构,主要开展战略性、原创性、前瞻性的科学研究与技术攻关。在大模型的应用价值日趋受到关注的背景下,上海人工智能实验室联合多家机构推出中量级参数的 InternLM-20B 大模型,其重点在于性能先进且应用便捷,以不足三分之一的参数量,达到了当前被视为开源模型标杆的Llama2-70B的能力水平。
自今年6月首次发布以来,书生·浦语已历多轮升级,此次其发布的20B量级模型具备更为强大的综合能力,在复杂推理和反思能力上尤为突出,因此可为实际应用带来更有力的性能支持;同时,20B量级模型可在单卡上进行推理,经过低比特量化后,可运行在单块消费级GPU上,因而在实际应用中更为便捷。
在相对有限的参数规模下,研究人员在架构设计时面临重要的取舍——提高模型的深度还是宽度?通过广泛的对照实验,书生·浦语团队发现,更深的模型层数更有利于复杂推理能力的培养。因此在架构设计时,研究人员把模型层数设定为60层,而7B与13B模型通常采用32层或者40层设计;同时内部维度保持在5120,处于适中水平。通过架构设计上的新取舍,InternLM-20B在较高计算效率的条件下实现了复杂推理能力的显著提升。
相比于此前的开源模型,InternLM-20B的能力优势主要体现在更长的语境。通过外推技术,InternLM-20B支持16K语境长度,可以支持长文理解、长文生成和超长对话。
工具调用是拓展大语言模型能力边界的重要手段,也是OpenAI近期推出大模型的重点特性之一。InternLM-20B对话模型支持了日期、天气、旅行、体育等数十个方向的内容输出及上万个不同的 API。
资本降温叠加反腐风暴,医疗企业如何走出寒冬
寒冬已来,投资界、企业界共议机遇与挑战。近期,医疗行业掀起反腐风暴,资本市场频传科创板第五套标准收紧,叠加资本寒冬,引发投资界、生物界以及相关企业思考面临的机会与挑战。在上海健康医学院产学合作处处长张苏华看来,我国医疗器械领域主要以低端生产性企业为主,真正具有创新性的企业较少,真正的核心发明专利较少,关键零部件依靠进口,需要产学研医方面真正相结合,以实现在关键技术方面进一步突破。0000俄方证实:乌军攻入俄境内!普京已知悉
俄总统新闻发言人佩斯科夫表示,俄国防部、联邦安全局和边防局已经向俄总统普京报告了乌方人员企图闯入别尔哥罗德地区的情况。综合外媒报道,当地时间21日,俄罗斯别尔哥罗德州州长格拉德科夫表示,一个乌军侦察破坏小组进入该州格赖沃龙区,俄强力人员正在为打击该小组采取措施。锤子财富2023-05-22 23:25:370000全球超七成订单被中国拿下 我国造船业上半年成绩单来了
中国造船业三大指标继续稳步增长,全球领先。今天(7月16日),工业和信息化部发布我国2024年上半年造船业最新数据,中国造船业三大指标继续稳步增长,全球领先。0000又有金融茶爆雷?疯狂地“炒茶”,有人1个月买了台宾利
茶,是用来喝的。继去年底“昌世茶”突然崩盘之后,不到一年时间,茶叶品牌泛茶“炒作盘”近日疑似爆雷。目前还暂未统计出爆雷的总金额,但有业内人士估算,这可能是广州芳村茶叶市场迄今为止涉案金额最大的“金融茶”事件。8月7日,第一财经记者来到位于广州与佛山交界处的泛茶研发中心,这里已经被警戒线围住,周围多家泛茶加盟店以及处于同一栋楼的泛茶交易平台都已大门紧闭。锤子财富2024-08-07 14:08:060000美法官裁定特朗普因民事欺诈案被处以4.54亿美元罚款
特朗普有一个月的时间缴纳罚款,并对判决提出上诉。当地时间2月23日,据美国有线电视新闻网(CNN)报道,美国法官阿瑟·恩戈伦(ArthurEngoron)正式裁定美国前总统特朗普因民事欺诈案被处以4.54亿美元罚款,其中包括3.55亿美元的罚款和近1亿美元的利息。据报道,特朗普有一个月的时间缴纳罚款,并对判决提出上诉。0000