nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo journalinfonormal searchdiv searchzone qikanlogo popupnotification paper paperNew
2025, 10, No.407 5-13
出版业的“复制危机”:大模型数据训练属性认定的双重效应与应对策略
基金项目(Foundation): 2024年度国家社会科学基金后期资助项目“从训练到生成:生成式人工智能的著作权问题研究”(项目编号:24FFXB055); 2025年度重庆市语言文字科研重点项目“人工智能时代语言数据主权保护机制”(项目编号:yyk25106); 西南政法大学知识产权保护协同创新中心2025年度学生科研创新项目“大模型数据训练的‘复制’难题及其求解”(项目编号:25IP013)的阶段性研究成果
邮箱(Email):
DOI: 10.19393/j.cnki.cn11-1537/g2.2025.10.004
发布时间: 2025-10-15
出版时间: 2025-10-15
移动端阅读
摘要:

生成式人工智能正以技术革新深刻重塑内容创作与分发流程。“复制+发行”作为出版产业版权生态链的基础,大模型数据训练的法律定性不仅关乎技术规范,更直接影响出版业内容生产、传播与价值实现。大模型数据训练是否被认定为法律意义上的“复制”,出版业将呈现出两种截然不同的生态演化路径。如若认定为“复制”将推动数据资产化转型,强化出版商控制权,但需防范“数据贫富差距”的出现;如若认定为“非复制”将可能导致内容价值贬损与内容传播主导权的丧失,加剧市场稀释效应及法律伦理冲突。面对现行法律的不确定性,出版商需针对大模型数据训练属性认定的双重效应进行适应性调整。“复制”认定下,可通过内容数据资产化运营、推动资源聚合与预防垄断、优化利益分配实现产业平衡;“非复制”认定下,可以通过强化数据产权声明与加强技术防御,依托反不正当竞争法缓解市场稀释,并加强数据合法性监督与“数据幻觉”治理,以期构建良好的大模型数据训练产业生态。

Abstract:

KeyWords:
参考文献

[1]李文冰. AIGC版权治理的兴起:争议议题、国际实践与启示[J].出版发行研究,2025(6):5-13.

[2][13]参看Thomson Reuters Enterprise Centre GmbH et al. v. Ross Intelligence Inc.,1:20-cv-613-SB(D. Del. Feb.11,2025),ECF No. 1234,at 5-6(Bibas,J.).

[3][14]参看Bartz v. Anthropic PBC,24-cv-05417(N.D.Cal. Jun. 23,2025),ECF No. 231,at 12-15(Alsup,J.).

[4][15]参看Kadrey v. Meta Platforms,3:24-cv-05417-WHA(N.D. Cal. Jun. 25,2025),ECF No. 345,at 8-10(Chhabria,J.).

[5]参看徐小奔.技术中立视角下人工智能模型训练的著作权合理使用[J].法学评论,2024,42(4):86-99;包赛君,肖冬梅.生成式人工智能训练数据的著作权法因应:欧盟版权例外规则及其对我国的启示分析[J].图书馆论坛,2025,45(6):123-132;关春媛.生成式人工智能训练版权合理使用探究:国际趋势、本土发展与规则构建[J].出版发行研究,2024(12):91-97.

[6]喻国明. ChatGPT浪潮下的传播革命与媒介生态重构[J].探索与争鸣,2023(3):9-12.

[7]辜凌云.新闻出版者邻接权的规范生成逻辑及制度选择反思[J].甘肃政法大学学报,2024(4):102-114.

[8] SAG M,YU P K. The globalization of copyright exceptions for AI training[J].Emory Law Journal,2025,74(5):163.

[9] BALGANESH S. The normativity of copying in copyright law[J].Duke LJ,2012,62:203-284.

[10]刘晓春.生成式人工智能数据训练中的“非作品性使用”及其合法性证成[J].法学论坛,2024,39(3):67-78.

[11]施小雪.重塑复制权:生成式人工智能数据训练的合法化路径[J].东方法学,2024(6):70-83.

[12]李春晖.人工智能训练侵犯作品复制权吗?[J].华东政法大学学报,2025,28(4):46-66.

[16][31][34]李嘉宁,董毅敏,王扬.人工智能时代出版业数据之困的破解路径[J].出版广角,2025(6):59,59,53.

[17]李弘.用内容引导力和技术创新力构建出版业的新质生产力[J].出版参考,2024(5):1.

[18]王志刚,吴璨.美国出版业应对AI训练侵权的措施及其启示[J].出版广角,2025(2):82-93.

[19] 2.5亿美元!OpenAI打包新闻集团5年版权,用于大模型训练及问答[EB/OL].(2024-05-23)[2025-08-04].https://www.thepaper.cn/newsDetail_forward_27478678.

[20]被用于AI训练的资讯值多少钱?亚马逊每年将付给《纽约时报》逾2000万美元[EB/OL].(2025-07-31)[2025-08-04].https://www.sohu.com/a/919397014_222256?s cm=10001.325_13-325_13.0.0.5_32.

[21]威立与Anthropic达成合作,推动AI在学术研究领域的整合进程[EB/OL].(2025-07-30)[2025-08-04].https://blog.sciencenet.cn/blog-3411312-1495706.html.

[22]张馨月,张立.从GPT到DeepSeek:技术演进赋能出版业态重构[J].出版广角,2025(5):3-9.

[23]田海平.人和人类还有未来吗?:关于人工智能“向善而行”的伦理思考[J].山东社会科学,2024(1):41-48.

[24]参看Raw Story Media,Inc. v. OpenAI,Inc.,1:24-cv-06795(S.D.N.Y. Nov. 7,2024),ECF No. 1234,at 5-6(McMahon,J.).

[25]参看AlterNet Media,Inc. v. OpenAI,Inc.,1:24-cv-06796(S.D.N.Y. Nov. 7,2024),ECF No. 567,at 3-4(McMahon,J.).

[26]张伟君.论大模型训练中使用数据的著作权规制路径[J].东方法学,2025(2):79-92.

[27]多家知名出版商起诉AI初创公司Cohere涉嫌侵犯版权[EB/OL].(2025-02-14)[2025-08-04].https://www.aibase.com/zh/news/15385.

[28]肖谦,丁毅,郑汉.出版行业应用生成式人工智能的现实困境与实践思路:基于对43家出版机构的访谈调查[J].编辑之友,2025(6):49-56.

[29]房金蓉.生成式人工智能的应用与出版业核心竞争力的重塑[J].编辑学刊,2025(4):114-118.

[30][33]蔡斐,张永坤.论出版数据产权:“三权分置”、规制逻辑与实现路径[J].出版发行研究,2025(6):38-39.

[32]李弘.出版融合发展过程中的AI因应思考[J].出版发行研究,2023(10):26.

[35]张惠彬,陈妮.AIGC时代新闻作品版权价值的实现进路[J].新闻与传播评论,2025,78(2):33-44.

基本信息:

DOI:10.19393/j.cnki.cn11-1537/g2.2025.10.004

中图分类号:G230.7

引用信息:

[1]张惠彬,何嘉怡.出版业的“复制危机”:大模型数据训练属性认定的双重效应与应对策略[J].出版发行研究,2025,No.407(10):5-13.DOI:10.19393/j.cnki.cn11-1537/g2.2025.10.004.

基金信息:

2024年度国家社会科学基金后期资助项目“从训练到生成:生成式人工智能的著作权问题研究”(项目编号:24FFXB055); 2025年度重庆市语言文字科研重点项目“人工智能时代语言数据主权保护机制”(项目编号:yyk25106); 西南政法大学知识产权保护协同创新中心2025年度学生科研创新项目“大模型数据训练的‘复制’难题及其求解”(项目编号:25IP013)的阶段性研究成果

发布时间:

2025-10-15

出版时间:

2025-10-15

检 索 高级检索

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文