新闻报道用于AI训练,能被禁止吗?
美国业界对于《纽约时报》的评价一直两极分化。有人认为《纽约时报》在每个议题上试图展现不同群体的观点,实现了帮助读者了解世界的最高抱负;但《经济学人》在12月14日的一篇文章中建议《纽约时报》应该在报道上采取一些措施,让读者能够独立思考,而不是一股脑把所有的观点都输出给他们。无论旁人观点怎样,《纽约时报》在美国新闻行业的领头地位毋庸置疑,内部新闻从业人员也确实认为自己的报道弥足珍贵。他们不会任由科技公司“偷走”报道。
2023年4月,《纽约时报》联系微软和OpenAI,试图就“知识产权问题寻求友好解决方案”,可能涉及商业协议和围绕生成式人工智能产品的“技术护栏”,但到了12月,《纽约时报》明显等不住也不等了,正式起诉这两家科技公司。OpenAI发言人林赛·赫尔德(Lindsey Held)表示对这起诉讼的“惊讶和失望”,在她看来,“友好对话”一直在“建设性地持续推进”。赫尔德指出OpenAI尊重内容创作者和所有者的知识版权,致力于与他们合作,确保他们从人工智能技术和新的收入模式中受益,最终找到一种互惠互利的合作方式。显然,《纽约时报》并不认为结果会是互惠互利。事实上,OpenAl自己也承认,与其他低质量来源的内容相比,《纽约时报》的高质量内容对GPT模型的训练更为重要,也更有价值。
不只《纽约时报》,2023年的夏天,许多公司或个人都对OpenAI提出指控,称该公司非法使用出版内容。美国喜剧演员莎拉·西尔弗曼(Sarah Silverman)2010年出版回忆录《The Bedwetter》,然而她却发现OpenAI在未授权的情况下非法使用这本回忆录的数字版本训练人工智能。《纽约时报》此次提起诉讼也吸取了一些前人的经验,它并没有指出“OpenAI的聊天机器人本身就侵权”的理论,而是提供了大量证据证明GPT-4输出的句子与《纽约时报》的原文高度重合,几乎达到了逐字逐句的效果。其中一个例子是微软聊天机器人必应(Bingo Chat)复制了《纽约时报》10月15日的报道——《哈马斯了解以色列军队的秘密》(The Secrets Hamas knew about Israel’s Military)。在一段原文为396个英文单词的文本展示中,必应原封不动复制了394个字。
灰色地带还是合理使用?
《纽约时报》的诉讼之所以极富争议性,是因为从根本上来讲,“生成式AI公司训练模型,对于受版权保护内容的使用程度”——这其实是个模糊的灰色地带。分歧的矛盾点就在于,训练并不是复制,而是学习——就如同OpenAI公司发言人赫尔德声称的那样。
专家指出,人工智能公司认为训练AI模型是创新之举,因此它们可能会使用所谓的“合理使用原则”为自己的行为进行辩护。“合理使用”是美国版权法中的一个概念,它允许人们在一定条件下,无需征得版权所有者的同意,可以自由使用受版权保护的部分内容,且不构成侵权。限制条件包括:使用目的是否具有商业意图或非营利教育目的,以及所使用的部分对于整部作品来说篇幅较短,并且不损害版权持有人的经济利益。
“炎”:文明之象,星火传承,
“炎”:世界共炎凉,全球新公民的共同议题与应对,
“炎”:回溯三十年的记录、记忆与怀抱,
挖掘文化、艺术、时尚、商业的热点与创新精神,
展望未来之“炎”。
即可购买《周末画报》2023年年刊↑
相关文章
猜你喜欢