大模型版权争议再起纽约时报起诉OpenAI和微软

锤子财富2023-12-28 15:02:000阅

OpenAI和微软涉嫌未经授权使用纽约时报数百万篇文章训练人工智能，OpenAI此前还被多名作家指控未经授权使用相关数据训练ChatGPT。

当地时间12月27日，纽约时报在美国起诉OpenAI和微软，起因是OpenAI和微软涉嫌未经授权使用纽约时报数百万篇文章训练人工智能，训练而成的聊天机器人如今作为一个消息来源，与新闻媒体竞争。OpenAI发布的大模型包括ChatGPT、GPT4，微软则投资OpenAI并允许其使用微软云技术，且将OpenAI的技术集成到微软产品中。

今年以来，围绕大模型训练所使用的数据和生成的作品，相关版权争议频起。OpenAI此前还被多名作家指控未经授权使用他们的书籍训练ChatGPT。

造成“数十亿美元损失”

在该诉讼中，纽约时报认为被告非法复制和使用具有独特价值的新闻作品，应为造成的数十亿美元法定和实际损失负责。纽约时报的广告收入依赖于在线网站订阅量，但AI聊天机器人的出现分流了流量。

《纽约时报》在诉讼中引用了几个案例，例如当被问及相关时事时，ChatGPT有时会生成纽约时报文章的逐字摘录，而这些文章在纽约时报的网站上是需要付费阅读的。此外，微软必应引擎会生成来自纽约时报网站的结果，纽约时报网站相关链接由此失去了点击量。纽约时报呼吁，相关公司销毁使用纽约时报具有版权的材料的聊天机器人模型和训练数据。

纽约时报还在一份电子邮件声明中称，微软和OpenAI要使用相关作品用于商业目的，需先获得许可，纽约时报已认识到生成式AI对公众和新闻业的影响力，“这些工具基于并继续使用新闻内容构建，而这些内容只有在我们和同行以高成本和专业知识进行报道、编辑和事实核查后才能获得”。

纽约时报表示，4月已联系OpenAI和微软，提出了关于使用具知识产权作品的担忧并寻求解决方案，但双方未达成解决方案。OpenAI发言人在一份声明中表示，OpenAI与纽约时报的对话在建设性地向前推进，OpenAI对诉讼感到惊讶和失望，微软则未对此事发表评论。

OpenAI持续面临版权争议。今年7月，数千名作家签署了一封致OpenAI及其他科技公司CEO的信，呼吁AI公司停止未经授权使用他们的作品。

今年9月，约翰·格里沙姆（John Grisham）、乔纳森·弗兰岑（Jonathan Franzen）等十余名作家对OpenAI提起诉讼，指控OpenAI使用他们的书籍训练ChatGPT，侵犯了版权，书籍作者既没有被通知也没有得到补偿。起诉书称，ChatGPT能生成书籍摘要，包括在线内容没有呈现的详细信息，表明书籍已被完整“喂”给了程序。OpenAI彼时则表示，是使用在网上找到的材料来训练ChatGPT，符合版权法规的规定。

OpenAI逐渐推动与一些新闻网站达成授权协议。7月，OpenAI与美联社达成协议，美联社授权OpenAI使用其部分新闻报道档案，美联社则将获得OpenAI的技术和产品专业知识。12月，OpenAI宣布与Business Insider、欧洲媒体Bild and Welt的母公司Axel Springer建立合作关系，Axel Springer向OpenAI授权并获得一定费用。

版权争议频发

关于生成式AI训练所使用数据是否未经授权获得、AI生成作品是否具有版权，今年以来争议和诉讼不断。

国内也因AI训练所用数据涉嫌侵权发生了诉讼。近期，有画师将小红书主体公司行吟信息科技（上海）有限公司以及小红书Trik软件主体公司诉至法庭，起因是小红书的AI模型涉嫌使用这些画师的作品训练。

此前接受第一财经记者采访时，北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军表示，数据能决定智能的水平，数据的重要性越来越大。大模型需要读尽可能全的数据，才能提供既强又新的服务。而目前一些模型抓取一些数据训练后就开始商用，其实智力水平还不高。未来大模型参数量一定会比现在大很多，大量且新的数据进入大模型体系，并非随便一个创业公司所能承担，很多数据需要付费。

监管层面，全球各地已在推动生成式AI监管法规出台。今年6月，欧洲议会投票通过《人工智能法案（AI Act）》，该法案要求披露生成式AI是否使用受版权保护的材料来训练。12月，欧盟委员会、欧洲议会和欧盟成员国代表就以上法案达成初步协议，这是全球首份针对AI监管的全面法规。

今年7月，国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》，其中提到生成式人工智能服务提供者应当“使用具有合法来源的数据和基础模型”，且“不得侵害他人依法享有的知识产权”。今年8月，美国版权局则围绕人工智能和版权问题向公众征询意见，以回答AI模型如何在训练中使用受版权保护的数据、AI生成的材料是否能获得版权等问题。

第一财经记者就是否使用媒体报道训练模型、是否经媒体授权向部分大语言模型提问。文心一言回答称“无法提供训练所用数据集具体来源和授权情况。我们会遵守相关法律法规和伦理规范，确保使用数据集时获得必要授权和遵循正当程序”，讯飞星火回答称“无法访问或了解模型的训练数据，一般来说如果一个模型使用了受版权保护的数据，需获得相应授权或许可”，谷歌Bard回答称“训练所用的数据集包括媒体报道，这些报道经过了媒体授权”。

针对AI创作作品是否拥有版权的问题，各地意见并不统一。今年8月，美国华盛顿一家法院裁定，未经人工输入而由AI创作的艺术作品不能获得版权。12月，韩国文化体育旅游部明确表示，人工智能（AI）创作的内容将不会获得版权注册。近日，北京互联网法院对AI生成图片著作权侵权纠纷第一案作出一审判决，则认为涉案AI图片是原告通过增加提示词设计并通过参数设置调整、优化而得，原作者进行了一定的智力投入，享有著作权。

大模型版权争议再起纽约时报起诉OpenAI和微软

0000

评论列表

共(0)条

相关推荐

A股最艰巨改革的见证者：股改“破冰”，牛市扑面而来
人心思变，改革成为共识。股权分置改革，是在A股市场经受了2001年始的持续近四年连绵弱市煎熬下启动的。
锤子财富新闻2024-11-18 14:40:45
0000
新闻
上海设立百亿级“耐心资本”投入未来产业，有哪些赛道将受益？
该未来产业基金有政府引导、长期支持、宽容失败等特点。100亿元由上海市财政全额出资，基金期限长达15年，还可根据情况申请延长3年。在9月7日举办的2024浦江创新论坛开幕式上，上海宣布组建总规模100亿元的未来产业基金，以政府投资引导的方式提振早期科技投资市场信心，促进创新源头的优秀成果转化为新质生产力。
锤子财富2024-09-12 04:42:21
0000
新闻
全国林草产业总产值超9万亿元，生态旅游超25亿人次
2023年，安排中央预算内投资275亿元，全面落实“双重”规划及专项建设规划。中央财政持续加大林草资金投入，安排林业草原转移支付资金1028亿元。2023年全年，全国新增公路绿化里程超8万公里，全国铁路绿化里程累计达5.86万公里，宜林铁路线路绿化率达87.9%。全年全国林草产业总产值达9.28万亿元，同比增长2.3%。
锤子财富2024-03-12 11:58:09
0000
新闻
新疆克孜勒苏州阿图什市发生5.5级地震
12月19日09时46分在新疆克孜勒苏州阿图什市（北纬40.02度，东经77.86度）发生5.5级地震，震源深度10千米。中国地震台网正式测定：12月19日09时46分在新疆克孜勒苏州阿图什市（北纬40.02度，东经77.86度）发生5.5级地震，震源深度10千米。
锤子财富2023-12-19 19:25:45
0000
新闻
抖音关窗，东方甄选独立APP开门：股价一日内涨超27%
未来，伴随非抖音渠道的拓展，以及产品价格带在下沉市场同样具有竞争力的供应链能力完善后，预计东方甄选可触达客群仍有很大空间。7月28日，东方甄选（01797.HK）股价一路上扬，截至发稿，股价38.45港元，涨27.32%。有消息称，因东方甄选自营品直播期间，主播在讲解自营产品配料表时配了相关二维码，被抖音判定引流和关闭店铺。针对该说法，截至发稿，抖音与东方甄选方面均未回应。
锤子财富2023-07-28 15:40:11
0002