Reddit demanda a Perplexity AI por extracción de datos no autorizada utilizada para entrenar sus sistemas de IA, destacando batallas legales sobre derechos de autor de contenido y prácticas de obtención de datos para IA.

Reddit ha demandado a Perplexity AI y empresas de extracción de datos por la recolección no autorizada de contenido de Reddit para el entrenamiento de IA, lo que plantea preguntas sobre la propiedad de los datos en IA. Esta demanda sobre datos de entrenamiento de IA resalta disputas legales significativas sobre derechos de autor de contenido.
Los documentos judiciales muestran que Reddit envió una orden de cese y desistimiento, pero Perplexity aumentó el uso de datos cuarenta veces. La demanda dice que el motor de respuestas de IA de Perplexity depende de las discusiones de Reddit, resaltando tensiones en chatbots de IA y sistemas automatizados. Perplexity trabajó con raspadores sin autorización, a diferencia de los acuerdos de Reddit con Google y OpenAI para APIs y SDKs de IA.
Esta es la segunda demanda de Reddit contra empresas de IA, mostrando un patrón de protección de contenido y estableciendo precedentes para el acceso pagado a datos. Para los desarrolladores que utilizan herramientas de raspado web o herramientas de extracción de datos, recuerda los límites legales. Perplexity niega las alegaciones y se defenderá; el resultado puede afectar la adquisición de datos de entrenamiento de IA y agentes y asistentes de IA.
El caso Reddit vs Perplexity define cómo las empresas de IA pueden usar contenido en línea para el entrenamiento. A medida que la IA evoluciona, las pautas claras de obtención de datos son críticas, influyendo en plataformas de automatización de IA y derechos de propiedad intelectual en la era de la IA.
Reddit demanda a Perplexity AI por presuntamente extraer contenido de Reddit sin autorización para entrenar sus sistemas de IA, evitando protecciones y accediendo a material con derechos de autor a gran escala a pesar de recibir una carta de cese y desistimiento.
Esta demanda podría sentar precedentes importantes sobre cómo las empresas de IA acceden legalmente a los datos de entrenamiento, potencialmente requiriendo acuerdos de licencia formales en lugar de extracción no autorizada, lo que podría afectar los costos y prácticas de innovación en IA.
La demanda podría resultar en multas, órdenes judiciales contra la extracción de datos o establecer nuevos estándares legales para el acceso a datos de entrenamiento de IA, potencialmente requiriendo acuerdos de licencia formales para las empresas de IA.
Otras empresas de IA podrían enfrentar demandas similares o necesitar ajustar sus prácticas de recolección de datos, potencialmente aumentando costos y ralentizando la innovación a corto plazo debido a reglas más estrictas de obtención de datos.
Reddit tiene acuerdos de licencia de datos existentes con empresas como Google y OpenAI, y esta demanda refuerza su enfoque de monetizar y proteger el contenido del usuario a través de arreglos formales.