生成式AI著作权纠纷频发,法律如何平衡创新与保护?
AI导读:
生成式AI产业迅速发展,但著作权纠纷频发。本文分析了生成式AI著作权纠纷中原告的诉求、被告的抗辩以及法院的判决思路和态度,并探讨了法律应如何平衡技术创新与知识产权保护。
Deepseek的横空出世,再一次打开了人们对生成式人工智能(以下简称生成式AI)产业发展的想象空间。生成式AI可能影响哪些行业?可能如何影响个人的学习和生活?这是当下很多人都在思考和关心的问题。也是导致DeepSeek经常服务器繁忙的重要原因。
不过,生成式AI方兴未艾之际,很多法律纠纷也接踵而至。比如,国际上很多著名的生成式AI企业近两年频频遭遇著作权纠纷。从这些纠纷及法律判决中,我们不仅可以洞悉生成式AI对法律的影响,而且可以分析成熟市场经济体的法院对生成式AI纠纷的判决思路和态度。这些对于我国AI产业的发展有重要的借鉴意义。
生成式AI著作权纠纷中,原告的诉求与被告的抗辩
如果用专业的语言描述,生成式AI的工作过程基本上包括三个步骤,即训练数据、交互数据和生成数据。
如果用通俗的语言描述,以上三个步骤大致是这样的:生成式AI通过输入海量的数据,对这些数据进行训练,把训练后的数据存放在自己的“数据仓库”里。
然后,生成式AI面对各种用户,和客户进行交流。用户提出问题,生成式AI把问题和自己“数据仓库”里的数据比对后,通过模型的运行,给用户输出答案。
答案可以有各种表现形式。比如,有的答案是音乐,有的答案是图片,还有的答案是文字。
生成式AI运行过程的三个步骤,都可能产生著作权纠纷。这些著作权纠纷中,原告基本上援引传统著作权侵权的基本法律要件提出控告。即,被告未经允许使用原告受著作权保护的作品,给原告造成损失。
比如,不久前,印度的亚洲新闻国际通讯社(ANI),向印度德里法院提起针对OpenAI的侵权诉讼。ANI指控OpenAI未经许可使用其新闻内容,侵犯其著作权。ANI请求法院判令OpenAI赔偿损失并永久禁止OpenAI使用其内容。
显然,根据ANI的指控, OpenAI在训练数据的过程中可能使用了ANI创作的内容。作为一家媒体,ANI及其工作人员在新闻制作过程中搜集了很多信息,经过加工,形成文章或新闻报道。这些文章或新闻报道,成为OpenAI等生成式AI训练数据的重要来源。
ANI不是起诉OpenAI的第一家媒体。此前,纽约时报以及原始故事媒体(Raw Story Media)等媒体公司,也对OpenAI提起著作权侵权诉讼。
纽约时报指控OpenAI用其发表的文章训练数据构成侵犯著作权。原始故事媒体和另外一家公司联合起诉OpenAI。他们起诉的理由稍有不同。他们认为,OpenAI在训练数据时用了他们的文章等内容,却“擦掉(scrape)”作者、文章名称、著作权保护标记等。
还有的原告指控:生成式OpenAI的生成数据,和他们的作品具有著作权法上所规定的“相似”性。因为符合著作权法上的“相似”性,就可以证明被告抄袭或剽窃了原告的作品。
面对这些指控,作为被告的人工智能公司往往援引著作权法中的“合理使用”原则。如何证明自己的行为构成 “合理使用”,则依据具体的场景有不同的理由。
……
(作者王佐发为西南科大法学院副教授)
(文章来源:澎湃新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

