7 月 5 日周三,据媒体报道,两位作家上周对 OpenAI 提起诉讼,声称他们的受版权保护的书籍在未经同意的情况下被用来训练 ChatGPT。这是在一周时间内 OpenAI 因为版权或隐私问题遭遇的第二起官司。
Paul Tremblay 和 Mona Awad 两位作家在诉状中称,ChatGPT 为他们的作品生成了 ” 非常准确的摘要 “。他们声称:
这些摘要只有在 ChatGPT 在他们的书籍上接受过训练后才可能呈现,这违反版权法。
Paul Tremblay 是《世界尽头的小屋》一书的作者,Mona Awad 的主要作品则包括《兔子》和《观察胖女孩的 13 种方法》。
ChatGPT 对《世界尽头的小屋》一书的介绍
风靡全球的 AI 聊天机器人 ChatGPT 接受了大量文本数据的训练。不过,OpenAI 从来没有透露训练 ChatGPT 使用了哪些数据和文本,但该公司表示,这一聊天机器人通常会抓取网络信息,包括使用存档书籍和维基百科。
该诉讼由原告向旧金山联邦法院提起,指控 OpenAI 训练数据中的 ” 大部分 ” 材料基于受版权保护的材料,其中包括 Tremblay 和 Awad 的书籍。但要准确证明 ChatGPT 如何以及在何处收集这些信息,以及作者是否因此遭受了经济损失,原告可能面临举证困难。
诉状引用了 ChatGPT 生成的书籍摘要,并指出这一聊天机器人出现的一些错误。然而,Awad 和 Tremblay 表示,摘要中大部分都是准确的,这意味着 “ChatGPT 保留了训练数据集中特定作品的知识。”
诉状称:
ChatGPT 从未复制原告在其出版作品中包含的任何版权管理信息。
这起诉讼并非 ChatGPT 遭遇的第一起诉讼。
上周,一群匿名人士在一项集体诉讼中声称,ChatGPT 的开发商 OpenAI 公司正在窃取 ” 大量 ” 个人信息,以训练其人工智能模型不顾一切地追逐利润。在这份长达 157 页的诉状中,这些匿名人士指责 OpenAI 从互联网上秘密抓取 3000 亿字,窃听了 ” 书籍、文章、网站和帖子,包括未经同意获得的个人信息 “,违反了隐私法。
律师事务所 Clarkson Law Firm 在上周三向旧金山联邦法院提交的诉状中表示,受到波及的受害者估计有数百万人,他们提出了 30 亿美元的潜在损失。