Wikipedia sopló de extractores a luchar por nosotros

La infraestructura, los sistemas y el ancho de banda de la Fundación Wikimedia y la enciclopedia universal gratuita Wikipedia son asaltadas por el tráfico de datos generados por Bots and Crawler AI, programas automáticos que extraen datos para alimentar los modelos de inteligencia artificial IA.

Además de Wikipedia, Wikimedia Commons también se asalta, que ofrece más de 140 millones de archivos de licencia abierta. La Fundación explica que el tráfico de datos y los extractores de Bot corresponden al 35% del total de las páginas que se muestran, pero también es el 65% de las solicitudes más caras que su infraestructura debe administrar.

Esto se debe a que los sistemas siempre están diseñados para cumplir con las solicitudes predecibles de los humanos, con la creación automática de caché local de las páginas y datos más solicitados basados ​​en tendencias y temas. Los lectores humanos tienden a leer una página y luego a seguir conexiones predecibles entre temas relacionados.Wikipedia denuncia el asalto de bots y extractores a

Por el contrario, los bots y el acceso a los rastreadores rara vez consultaban páginas y documentos, no atendidos por caché local, pero que requieren la intervención de la base de datos central, mucho más caro. Esto se acompaña de la descarga de cantidades masivas de datos de Wikimedia Commons.

Por lo tanto, el informe de Wikimedia «la cantidad de tráfico generado por los extractores de BOT no tiene precedentes y tiene riesgos y aumentos de costos». La infraestructura diseñada para el tráfico humano, lucha por mantenerse al día con las solicitudes exousivas de datos para alimentar los modelos de IA.

La División de Rolabilidad del sitio de Wikimedia lucha diariamente para asegurarse de que los servicios permanezcan activos y rápidos para el acceso humano, interviniendo constantemente para reducir o deshabilitar el tráfico de IA. Este Se traduce en un tiempo de soporte más pequeño para el contenido, los autores y para los usuarios que contribuyen a la enciclopedia en línea, además de involucrar mayores costos para sistemas, infraestructura y ancho de banda.Wikipedia denuncia el asalto de bots y extractores ai - Macitynet.itEn última instancia, los costos de las solicitudes de bots y extractores ai son mucho más altos que las solicitudes de los lectores humanos y, además, crecen rápidamente. Wikimedia reitero Que su contenido es gratuito, pero su infraestructura no lo es.

Wikipedia se basa principalmente en el trabajo de voluntarios y en las donaciones de los usuarios. Quién sabe si las nuevas empresas y los gigantes se benefician más de esta recopilación de datos también encontrará una solución para no hacer que Wikipedia y la Fundación Wikimedia impulsen.

Los modelos de los peces en todas partes con manos completas: vea el caso de la ola de imágenes de estudio de estudio de Gibli generadas con ChatGPT y la acusación de O’Reilly en el entrenamiento con docenas de libros en su catálogo.

Para todos los artículos dedicados a la inteligencia artificial, comenzamos desde esta página de Macitynet.