在之前的文章中,我们讨论了针对机器学习(machine learning)行为可以援引新加坡《版权法》下的计算分析条款(computational analysis provision)作为使用他人版权作品的抗辩理由。在本文中,我们将进一步对机器学习是否还可以援引新加坡《版权法》中的合理使用条款作为抗辩理由进行说明和论证。在有可能援引计算分析条款作为辩护理由的情况下,将合理使用作为机器学习中使用版权作品的抗辩理由这一讨论可能在一定程度上仅能停留在纯学术讨论层面。即便如此,在机器学习的背景下考虑合理使用抗辩仍然是有益的,尤其是在有可行案例可以支撑该抗辩的情况下。
尽管目前尚不存在直接的判例,新加坡上诉法院的一些判决可能对我们了解新加坡法院如何将新加坡《版权法》第35 条中的原则适用于机器学习具有指导意义。
在“GYP 诉 Promedia”一案中,原告主张被告侵害了其企业名录和黄页目录之作品的版权。具体而言,被告在制作企业名录的过程中从原告的企业名录和黄页目录中获取数据,然后将这些数据加入自己的数据库。为了更方便地使用原告上述作品中的数据,被告可能使用了影印、扫描等方式来获取数据。
新加坡上诉法院基于多个理由驳回了原告提起的版权侵权诉讼,其中就包括支持被告援引版权法第 35(2) 条下的合理使用抗辩。在本案中,原告认为被告的侵权行为是对原告的作品进行影印和扫描,该行为的目的是让被告能够随时查阅这些作品中的数据。
上诉法院在审理过程中需要判断的是被告为了完成其企业名录中的条目,而通过影印/扫描原告的电话黄页的方式“访问数据”的行为是否能够援引合理使用条款进行抗辩。在判决中,上诉法院最终基于合理使用判定被告胜诉,在论述合理使用(第 35(2) 条)是否适用时,该法院提出需要考量的因素包括:
下表列明了上诉法院在本案中对以上 5 个考量因素的具体解释,并基于此得出了支持被告援引第 35 条下的合理使用作为抗辩理由的结论:
|
因素 |
法院认为 |
1 |
使用的目的和性质 |
被告进行复印/扫描的目的是为了方便员工比较或识别其数据库中未包含的名录,并在此基础上更新其数据库。这种活动属于商业研究附带的“内部活动”,并不会影响原告作品取得版权的基础,即“数据的特定排列”这一独创性内容。因此,这一因素并不影响对于合理使用的认定。 |
2 |
作品的性质 |
在本案中,原告的作品得到版权法保护的要求“非常高”,“只有在几乎完全复制了原告的黄页,并且完全按照原告的排列方式来进行复制的情况下,才能初步认定构成侵权。”因此,作品的性质因素也有利于法院得出被告的使用属于第 35(2)(b) 条下合理使用的结论。 |
3 |
使用部分在版权作品中所占的比例,或者是否构成版权作品的实质性部分 |
上诉法院认为,由于本案中版权保护的范围较窄,不应过度关注第 35(2)(c) 条有关复制部分是否构成整个作品的实质性部分的规定。 |
4 |
使用行为对版权作品潜在市场或价值的影响 |
法院“不认为根据第 35(2)(d) 条,这种使用行为会侵占原告作品的潜在市场。如果被告使用的是原告的企业名录的打印件,而不是进行了复印或扫描,那么初步看来,被告的行为不会侵犯原告任何版权。” |
5 |
在合理时间内以普通市场价格获得作品的可能性 |
“由于原告的作品是免费的,因此被告(在使用时)并不需要征求原告的许可,特别是在被告想要使用的内容本就是不受版权保护的事实内容的情况下。” |
上诉法院对“合理使用”原则的以下解释,可能对我们在涉及机器学习的相关案件中如何援引此原则作为抗辩理由具有指导意义:
综上所述,笔者认为,如果机器学习抓取数据的对象是基于事实的内容或信息,则有很大概率可以成功援引第 35 条下的“合理使用”作为抗辩理由。
关于第 2 个因素(作品或改编作品的性质),人工智能的开发者可以采取措施防止或是尽量减少输出内容由于与版权作品构成实质性相似而被认为侵权。比如,针对输出内容进行定向过滤。在这个层面上,如果开发者的输出过滤技术足够强大或足够有效,即能够防止对用户生成与原始训练数据基本相似的输出,那么第二个因素就有可能对开发者有利。
笔者向 perplexity.ai 输入了一个问题,并收到了以下回复:
问题 – 避免 AI 聊天机器人输出内容侵犯版权的措施
回复 - “采用技术手段对输出内容进行过滤,在输出内容被提供给用户之前,检测并屏蔽可能侵犯他人版权的内容。这方面的措施包括过滤掉从已知版权作品中逐字复制的段落。
向用户提供明确的指南和服务条款,并在其中规定输出内容不得用于商业目的或侵犯知识产权。要求用户确保遵守相关规定并对其行为负责。
不过,即使采取了以上措施,仍然存在无意中侵犯版权的风险,尤其是在训练数据无意中包含了版权材料的情况下。有关 AI 生成内容的法律格局目前仍在发展完善之中,政策制定者正在努力解决版权所有权与合理使用之间的边界问题。目前的研究方向是通过开发更强大的技术手段,以求减少因 AI 能力进步而带来的侵权风险。”
笔者认为,上述措施,如果确实能够付诸实践的话,可能会成为新加坡法院在判断机器学习场景是否可以援引新加坡《版权法》下的“合理使用”制度作为抗辩理由时的重要考量因素,特别是在训练数据集本质上属于事实信息的情况下。不过,需要注意的是,对于机器学习行为是否能够解释为新加坡版权法下的“合理使用”的问题,不同主体的观点可能并不一致。
目前尚不明确以上论述的观点是否会在新加坡法院或邻国马来西亚(该国《版权法》中同样包含合理使用条款)法院得到支持。
有关机器学习是否可以援引“合理使用”作为辩护理由系列文章的第二部分,请点击。