维基百科称AI爬虫致运营成本激增,呼吁规范数据使用

维基媒体基金会近日表示,AI训练数据集的网络爬虫正对其运营造成显著压力。其旗下维基共享资源存储大量多媒体资料,自2024年1月以来,相关下载带宽增长50%,主要源于自动化程序而非人类用户。

基金会指出,自动爬虫的频繁访问加剧了服务器负担,其中35%的浏览量消耗了65%的核心数据中心流量资源。此外,爬虫甚至触及开发环境关键系统,进一步增加管理成本。

维基媒体基金会呼吁建立可持续的数据使用规范,避免因无序抓取导致“公地悲剧”,强调免费内容不意味着基础设施可无限制消耗。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1