En los primeros años, lograr que modelos de inteligencia artificial como ChatGPT o su rival Cohere generaran respuestas similares a las humanas requería grandes equipos de trabajadores de bajo costo que ayudaran a los modelos a distinguir hechos básicos como si una imagen era de un automóvil o de una zanahoria.
Pero las actualizaciones más sofisticadas de los modelos de IA en un ámbito ferozmente competitivo ahora exigen una red en rápida expansión de entrenadores humanos que tengan conocimientos especializados, desde historiadores hasta científicos, algunos con títulos de doctorado.
“Hace un año, podíamos salirnos con la nuestra contratando estudiantes universitarios para enseñarle a la IA cómo mejorar”, dijo el cofundador de Cohere, Ivan Zhang, hablando de sus capacitadores humanos internos.
“Ahora tenemos médicos licenciados que enseñan a las modelos cómo comportarse en entornos médicos, o analistas financieros o contadores”.
Para obtener más formación, Cohere, cuya última valoración superaba los 5.000 millones de dólares, trabaja con una startup llamada Invisible Tech. Cohere es uno de los principales rivales de OpenAI y se especializa en IA para empresas.
La startup Invisible Tech emplea a miles de formadores que trabajan de forma remota y se ha convertido en uno de los principales socios de empresas de IA, desde AI21 hasta Microsoft, para entrenar sus modelos de IA para reducir errores, conocidos en el mundo de la IA como alucinaciones.
“Contamos con 5.000 personas en más de 100 países alrededor del mundo que tienen doctorados, títulos de maestría y especialistas en trabajo del conocimiento”, dijo el fundador de Invisible, Francis Pedraza.
Invisible paga hasta 40 dólares por hora, dependiendo de la ubicación del trabajador y la complejidad del trabajo. Algunas empresas como Outlier pagan hasta 50 dólares por hora, mientras que otra empresa llamada Labelbox dijo que paga hasta 200 dólares por hora por materias de “alta especialización” como física cuántica, pero comienza con 15 dólares por temas básicos.
Invisible se fundó en 2015 como una empresa de automatización de flujos de trabajo que buscaba digitalizar el menú de entregas de comida a domicilio de empresas como DoorDash. Pero todo cambió cuando una empresa de investigación relativamente desconocida llamada OpenAI se puso en contacto con ellos en la primavera de 2022, antes del lanzamiento público de ChatGPT.
“OpenAI nos planteó un problema: cuando le hacías una pregunta a una versión temprana de ChatGPT, la aplicación alucinaba. No podías confiar en la respuesta”, dijo Pedraza a Reuters.
“Necesitaban un socio de entrenamiento de IA avanzado para proporcionar aprendizaje de refuerzo con retroalimentación humana”.
OpenAI no respondió a la solicitud de comentarios.
La IA generativa produce contenido nuevo basándose en datos anteriores utilizados para entrenarla. Sin embargo, a veces no puede distinguir entre información verdadera y falsa y genera resultados falsos conocidos como alucinaciones. En un ejemplo notable, en 2023, un chatbot de Google compartió información inexacta sobre qué satélite tomó por primera vez fotografías de un planeta fuera del sistema solar de la Tierra en un video promocional.
Las empresas de IA son conscientes de que las alucinaciones pueden desvirtuar el atractivo de GenAI para las empresas y están probando diversas formas de reducirlo, incluido el uso de entrenadores humanos para enseñar el concepto de realidad y ficción.
Desde que se unió a OpenAI, Invisible afirma que se ha convertido en socio de capacitación en IA de la mayoría de las empresas de GenAI, incluidas Cohere, AI21 y Microsoft. Cohere y AI21 confirmaron que son clientes. Microsoft no confirmó que sea cliente de Invisible.
“Todas estas son empresas que tenían desafíos de capacitación, donde el costo número uno era el poder de cómputo, y luego el costo número dos era la capacitación de calidad”, dijo Pedraza.

¿CÓMO FUNCIONA?

OpenAI, que inició el frenesí en torno a GenAI, tiene un equipo de investigadores acertadamente llamado “Equipo de Datos Humanos” que trabaja con entrenadores de IA para recopilar datos especializados para entrenar sus modelos como ChatGPT.
Los investigadores de OpenAI idean varios experimentos para reducir las alucinaciones o mejorar el estilo de escritura y trabajan con entrenadores de IA de Invisible y otros proveedores, dijo una fuente familiarizada con los procesos de la empresa.
En este momento se están realizando docenas de experimentos, algunos con herramientas desarrolladas por OpenAI y otros con herramientas de proveedores, dijo la fuente.
En función de lo que quieran las empresas de IA (desde mejorar en historia sueca hasta realizar modelos financieros), Invisible contrata trabajadores con títulos relevantes para esos proyectos, lo que reduce la carga de gestionar cientos de formadores por parte de las empresas de IA.
“OpenAI tiene algunos de los científicos informáticos más increíbles del mundo, pero no son necesariamente expertos en historia sueca o en cuestiones de química o biología o cualquier cosa que puedas preguntarles”, dijo Pedraza, y agregó que más de 1.000 trabajadores contratados atienden solo a OpenAI.
Zhang, de Cohere, dijo que personalmente utilizó los entrenadores de Invisible para encontrar una forma de enseñar a su modelo GenAI a encontrar información relevante de un gran conjunto de datos.

COMPETENCIA

Entre los competidores en este espacio se encuentra Scale AI, una start-up privada valorada en 14.000 millones de dólares que proporciona conjuntos de datos de entrenamiento a las empresas de IA. También se ha aventurado en el área de proporcionar entrenadores de IA y cuenta con OpenAI entre sus clientes. Scale AI no respondió a las solicitudes de entrevista para este artículo.
Invisible, que ha sido rentable desde 2021, ha recaudado solo $8 millones de capital primario,
“Somos propiedad del equipo en un 70% y sólo el 30% de los inversores”, dijo Pedraza. “Facilitamos rondas secundarias y el precio negociado más reciente fue de 500 millones de dólares”. Reuters no pudo confirmar esa valoración.
Los capacitadores humanos comenzaron a capacitar a personas en IA a través de trabajos de etiquetado de datos que requerían menos calificación y también se pagaban menos, a veces tan solo 2 dólares., abre una nueva pestaña, realizado principalmente por personas en países africanos y asiáticos.
A medida que las empresas de IA lanzan modelos más avanzados, la demanda de capacitadores especializados y en docenas de idiomas está en aumento, lo que crea un nicho bien remunerado donde los trabajadores de una variedad de materias podrían convertirse en capacitadores de IA sin siquiera saber cómo codificar.
La demanda de las empresas de IA está llevando a la creación de más empresas que ofrecen servicios similares.
“Mi bandeja de entrada está prácticamente inundada de nuevas empresas que aparecen aquí y allá. Veo esto como un nuevo espacio en el que las empresas contratan personas solo para crear datos para laboratorios de inteligencia artificial como el nuestro”, dijo Zhang.
Fuente: reuters.com
Comparte: