Noticias de entrenamiento de algoritmos
Tengo la sensación de que pronto veremos más y más mensajes como este: Prensa asociada (AP) Ja firmó una alianza con los desarrolladores de algoritmos como Dall E o ChatGPT, IA abiertaque permitirá a la agencia de noticias cooperativa de América del Norte aprovechar la tecnología y los productos de OpenAI a cambio de permitir que los algoritmos de OpenAI lo hagan por una tarifa familiarizarse con el vasto archivo de textos periodísticos ha sido generado por la agencia desde 1985.
AP fue la primera agencia creada a través de una alianza con la empresa en 2014 Información automatizadaA Usa algoritmos para generar algunos de tus mensajescomo Resúmenes de resultados financieros cualquiera cronicas deportivas, lo que le permitió ampliar significativamente su cobertura. Actualmente, agencias como Bloomberg utilizan este tipo de tecnología en aproximadamente un tercio de las noticias que producen. En el caso de AP, que entrega noticias en inglés, alemán, holandés, francés y español todos los días, la mera disponibilidad de tecnologías de traducción eficientes que pueden mantener un estilo particular ya puede ser una ventaja significativa y dejar a muchas personas sin trabajo. responsable de llevar a cabo estas traducciones.
Para OpenAI, los mensajes AP son una buena manera de tener texto que se puede usar con ciertas garantías para entrenar sus algoritmos generativos, lo que podría complicarse si cumpliera con algunos de los requisitos que obtienen las empresas constructoras de algoritmos generativos, como p. B. los de algunos Artista, escritor, cómico o la de eso Repositorio de imágenes Getty Images Vienen a prosperar. En un escenario donde la obtención de datos para entrenar algoritmos es cada vez más compleja, acuerdos como este pueden tener un valor significativo, ya que reutilizar los mismos repositorios una y otra vez obviamente trae consigo muchas limitaciones.
El tiempo es importante: a medida que las empresas de tecnología que desarrollan este tipo de algoritmos intentan convencer a más propietarios de datos para que los capaciten con ellos, muchas empresas de todas las industrias están considerando trabajar en el uso de sus propios datos para entrenar sus propios algoritmos para usar, o si deberían esperar. hasta que utilizan los desarrollados por estas empresas tecnológicas. En muchos sentidos, el escenario resultante de estas elecciones configurará la próxima etapa de la tecnología, que podría volver a estar dominada por unas pocas empresas o, por el contrario, hacia un modelo más democratizado y diverso, con contribuciones más diversas o con posibilidad de apoyando el desarrollo de herramientas de código abierto para avanzar.
Hasta el momento, prácticamente todas las empresas que han desarrollado este tipo de herramientas se han limitado a obtener información directamente de Internet. Raspar, algo cuya legitimidad ha sido cuestionada por algunos propietarios de esta información. Él raspado web es sin duda una herramienta controvertida: aunque muchos defender El legalidad Otros casos sirvieron para recopilar información publicada en internet clasificado como ofensivo. En este sentido, el acuerdo firmado entre AP y OpenAI representa un importante precedente y posiblemente un cambio de rumbo en el desarrollo de este tema estratégico.