分享到微信

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。

警惕“语料投毒”，守住AI问答法治底线丨法经兵言

第一财经 2025-12-23 20:22:03 听新闻

作者：陈兵 ▪ 许英杰责编：刘菁

生成式问答已成为一些营销者竞相争夺的新型资源。

在生成式人工智能快速发展的背景下，网络内容生产呈现出新的技术路径和商业模式，一种新型数字营销技术——生成式引擎优化（GEO）正在重塑信息分发与用户决策路径，对既有内容治理体系提出了更高要求。

GEO通过优化内容适配大语言模型检索偏好，使特定品牌在AI回答中获得优先展示。相关报告显示，2025年中国GEO市场规模达21亿元，预计2027年将暴涨至242亿元。但技术狂飙的背后，AI内容生成领域灰色产业链滋生、内容生态污染等乱象也随之凸显。个别服务商已形成品牌付费、软文铺稿、优化数据抓取的完整产业链，相关广告中介设置付费包月服务，即可实现品牌稳定植入AI回答，电商平台甚至出现批量发布软文的工具售卖，“语料投毒”“虚假信源”等恶意操作屡见不鲜。

在此背景下，如何在网络内容生产领域平衡技术创新与规范发展，构建适配生成式引擎优化等新技术特征的治理体系，成为亟待破解的难题。

AI技术革新网络内容生产

GEO是一项随着生成式人工智能问答兴起而出现的新型营销技术，它让AI更倾向于引用特定信息，从而提升特定品牌或产品在AI回答中的引用率。

具体而言，广告营销公司会围绕目标品牌关键词撰写结构严谨、数据丰富的文章，并发布在AI常抓取的第三方平台上，使这些内容易于被AI模型检索和引用。关键词挖掘、生成对应文章、选择高权重平台投放等步骤，都是为了训练AI理解并推荐特定品牌。

GEO作为新一代生成式人工智能技术应用，其合法性取决于具体实施方式和实施目的。通过内容优化、权威信息来源构建和用户意愿匹配等合规手段提升AI回答的可见性，属于正当商业竞争。但采用语料投毒、提示词注入和流量劫持等恶意技术干扰算法，其本质是通过影响用户选择干扰他人网络服务正常运行，破坏了公平竞争秩序。这种利用不正当手段提高特定品牌曝光率的做法，不仅妨碍了其他合法经营者获得流量的机会，也侵害了消费者获取客观信息的权益。

在生成式AI问答平台兴起的推动下，网络内容生产与分发格局呈现新一轮重构。GEO被广泛尝试于新兴的AI问答平台。近来年，我国涌现了一批热门大模型问答产品，如DeepSeek、Kimi、豆包等，拥有着庞大用户基础。据中国互联网信息中心（CNNIC）《中国互联网络发展状况统计报告》，截至2024年12月，我国生成式人工智能产品的用户规模达2.49亿人，占整体人口的17.7%。利用生成式人工智能产品回答问题的用户最为广泛，使用率达77.6%。这表明AI问答平台正成为新的流量入口，吸引品牌方高度关注。而在我国热门AI问答平台上，品牌植入情况确实存在，生成式问答已成为一些营销者竞相争夺的新型资源。

网络内容生产市场在GEO产业化过程中逐渐出现灰色化趋势，这种趋势加剧了对内容生态和治理秩序的冲击。围绕GEO的广告投放已悄然形成灰色产业链。一些商家公开宣称能通过GEO技术让客户品牌稳定占据AI答案的前列，并按周期收取费用。根据相关调查报道，某些广告代理公司以套餐方式兜售GEO服务，根据投放关键词数量、平台数量和时长等报价，从每年数千元到数十万元不等。甚至电商平台也出现了相关代运营和软件工具的售卖信息，标榜可以批量发布“软文”以提升AI抓取率。

AI应用给内容生产治理带来挑战

生成式人工智能驱动的内容生产方式变革，暴露出一系列深层次的治理挑战，其典型表现便是GEO技术的滥用对内容生态、市场秩序与用户权益等造成冲击。

客观中立的AI回答异化为暗中充值付费的广告、批量生成的虚假软文污染训练语料，导致虚假内容压制了优质信息；算法被暗中干预后，用户难以分辨推荐的客观性与商业性，既破坏市场公平竞争，更侵犯消费者知情权，干扰甚或诱导消费者选择，破坏公平合理安全可信的营商环境和消费环境。

在内容生产治理层面，技术的滥用直接破坏了内容供给结构，干扰了算法“向上向善”的价值导向。首先，不良GEO广告公司为提高品牌曝光，批量生成大量虚假和劣质的营销内容，结果是污染AI训练语料，干扰模型判断。AI问答模型会概率抓取非权威的自媒体文章，缺乏甄别真实性的能力，这导致某些品牌通过堆砌劣质内容在AI答案中占据突出位置，客观上削弱了高质量内容的权重；其次，GEO的滥用使得AI模型的决策机制更加不透明。大模型的“黑箱”工作机制，算法权重及引用偏好不透明，使得平台难以精准识别并剔除所有恶意植入内容，从而破坏算法结果的客观性和准确性。生成式引擎优化的滥用干扰了算法的公正性，不但损害用户信任，也扰乱了平台的正常运营秩序。

在网络内容生产的竞争环境上，技术的滥用容易演变为扭曲市场公平竞争秩序的不正当手段。黑帽GEO行为本质是通过滥用技术手段干预AI信息输出，以获取竞争优势，形成虚假宣传、混淆行为等不正当竞争行为。

精准治理网络内容的法治举措

网络内容生产在技术迭代与市场需求的双重作用下愈加复杂，面对由此产生的内容操控、新型不正当竞争以及消费者权益受侵等风险，网络内容治理必须坚定法治化方向，通过法律制度、责任机制与多元共治，构建科学、系统、可执行的内容治理路径。

第一，在法律规范层面，应加快建立健全生成式人工智能内容治理法律体系，通过顶层设计回应新技术语境下网络内容生产的风险形态。现行《反不正当竞争法》《广告法》等市场监管法律，虽涵盖虚假宣传和广告义务，但对于GEO这种新型操控行为缺乏专门定义和细化规定，平台责任界限也不够明确。为此，需从立法层面尽快完善：一是明确GEO行为的法律定性，细化语料投毒、伪造虚假信源等黑帽GEO行为的定性，明确白帽GEO的合规边界等细化规定，以良法促进技术向善；二是细化AI平台的责任边界，明确平台在GEO操控治理中的法定义务与法律后果，以法律的精准发力遏制恶意技术滥用行为蔓延，确保在网络内容治理领域有法可依、有规可循。

第二，强化平台义务。网络内容生产在平台层面应当通过强化主体责任来提升治理能力，平台作为AI服务的提供者，应压实AI大模型服务提供者在广告识别和内容管理方面的主体责任，构建事前、事中、事后全流程监管。GEO操控本质是利用AI模型基于概率生成和缺乏事实判断的技术缺陷，通过恶意污染语料库、诱导模型生成等方式实现商业推广或信息误导，平台可以采取以下措施防范 GEO操控：

首先，应建立广告识别机制，加强对生成内容中商业信息的监测。广告识别机制对回答中出现的显著商业推广信息进行标记提示，对异常高频出现特定品牌的回答进行评估处理。《广告法》和《互联网广告管理办法》都明确规定，广告应当具有可识别性，通过大众传播和互联网媒介发布的广告必须显著标明“广告”，与非广告信息相区别。

其次，应构建可信语料库。建立信息可信度分级体系，设立语料库健康指数监控机制，对未经验证的内容标注争议信息。同时，通过优化语料筛选机制，在模型训练和联网抓取环节过滤明显的垃圾营销信息，剔除含异常关键词或广告倾向的内容来源。

最后，应强化模型输出可控性。大模型平台作为信息内容服务方，应当履行信息内容管理主体责任。通过引入人工或第三方审查，对生成结果定期人工抽检，抽检模型输出以发现并清理营销内容。AI平台作为AI内容生态的第一道防线，应将广告识别与内容治理技术融入模型设计和运营流程，压实事前预防、事中监测、事后处置的全流程主体责任。

第三，健全行业自律与第三方参与的共治机制。网络内容治理还需要依托行业自律与独立机构参与构建多元共治格局，以弥补单一监管和单一平台治理的局限性。一方面应加强行业自律。各大平台可联合制定自律标准，明确禁止数据投毒、算法干预等GEO行为的具体标准，行业协会可对各平台落实情况进行监督检查，形成行业内部的约束机制，实现全链条可追溯。另一方面，引入第三方机构对AI回答内容合规性进行审查。可由独立的内容监管机构、行业组织或消费者权益保护机构定期抽查AI问答，发现隐性广告和虚假信息后及时反馈平台整改。第三方的客观评估能为监管提供参考。通过法律监管、行业自律和第三方监督相结合，能够多层次地遏制网络内容生产中的广告乱象，营造公开透明、健康有序的内容生态。

第四，完善消费者权益保护渠道，建立针对AI生成内容广告的投诉举报机制和维权路径。一方面，平台层面应设立专门的投诉入口，便于用户提交涉及虚假广告投诉，由平台迅速核查处置。《生成式人工智能服务管理暂行办法》第十五条规定：提供者应当建立健全投诉、举报机制，设置便捷的投诉、举报入口，公布处理流程和反馈时限，及时受理、处理公众投诉举报并反馈处理结果。另一方面，监管层面应明确受理此类投诉的主管机关，确保用户发现生成式AI服务违法违规时可以向有关部门举报并获得回应。监管部门可建立跨部门协作的处理流程，对经查属实的GEO虚假广告行为依法处罚，并督促相关平台整改。

技术的滥用引发的语料污染、竞争失序与权益侵害等问题，已对网络内容生产生态与数字经济秩序构成严重威胁。必须坚持法治化方向，通过完善法律规范、压实平台责任，构建以依法监管为根本、行业监管为引导、平台治理为主体、行业自律为支撑、消费者权益保障为目标的协同治理机制，共同筑牢网络内容生产的法治底线，推动数字经济在创新驱动与规范发展之间实现高质量、可持续发展。

（陈兵系南开大学竞争法研究中心主任、法学院副院长，教授，南开大学数字经济交叉科学研究中心研究员；许英杰系南开大学数字经济交叉科学研究中心博士生）