Operai está presionando por puntos de referencia de IA específicos de la industria: por qué eso importa

abril 11, 2025

47

Tabla de contenido

Los resultados de rendimiento de narración generalmente acompañan el divulgación de cada nuevo maniquí de IA para mostrar qué tan perfectamente pueden funcionar los modelos en varias tareas. Sin incautación, estas tareas no se atienden a industrias individuales, sino que son más generales, como las matemáticas de la escuela primaria (GSM8K) o el razonamiento de posgrado (GPQA).

Encima: Chatgpt recordará todo lo que le dices ahora, como un definitivo asistente personal

Software de Pioneros de Operai

Para guatar ese infructifero, Openai lanzó el software Pioneers Operai, destinado a avanzar en el ampliación del maniquí de IA para industrias específicas y casos de uso del mundo verdadero. El software es un esfuerzo de dos puntas en el que las empresas colaborarán con investigadores de Operai para desarrollar evaluaciones más específicas de dominio y modelos ajustados.

Estamos lanzando el Software de Pioneros de OpenAI: una asociación entre OpenAI y compañías que construyen productos AI avanzados para (a) modelos intensamente finos que superan a las tareas específicas de dominio de detención valía, y (b) construyen mejores evals del mundo verdadero que permitan a las industrias mejor … https://t.co/ccvkgmyqjdd
– Brad LightCap (@BradlightCap) 9 de abril de 2025

En la publicación del blog, Openai compartió que «industrias como legales, finanzas, seguros, atención médica, contabilidad y muchos otros les faltan una fuente unificada de verdad para la evaluación comparativa de modelos». Como resultado, Operai ahora trabajará con múltiples compañías en cada industria para desarrollar esas evaluaciones, que están dirigidas no solo a desarrollar modelos sino igualmente a desarrollar una mejor confianza entre el manifiesto y estos sistemas.

LEER Cómo puede obtener Microsoft 365 (anteriormente Office) de forma gratuita - 3 maneras fáciles

Asimismo: La IA no está golpeando una horma, se está volviendo demasiado inteligente para los puntos de narración, dice Anthrope

La investigación ha resaltado este infructifero de puntos de narración como una brecha importante en la IA para los casos de uso empresarial. Por ejemplo, Silvio Savarese, Patrón de Investigación de AI de Salesforce, publicó una publicación de blog sobre Inteligencia Genérico Enterprise (EGI), un concepto que está pionero que se refiere a soluciones de IA más avanzadas adaptadas a las deyección específicas de dominios de las empresas. En una conversación con ZDNet, compartió que uno de los principales pasos necesarios para conservarse a EGI son los puntos de narración que consideran evaluar las funciones específicas del dominio.

Refinar los modelos existentes

Más allá de las evaluaciones, Operai igualmente colaborará con el equipo para refinar los modelos existentes para tres casos de uso específicos de la industria utilizando una técnica conocida como ajuste de refuerzo (RFT). El equipo de Operai ayudará a gobernar a las compañías sobre cómo usar RFT, y luego las compañías pueden animarse cómo implementar los modelos, que deberían estar listos para la implementación a gran escalera, según OpenAI.

Asimismo: La carrera maniquí AI de repente se ha acercado mucho más, dicen Stanford Scholars

La primera cohorte consistirá en un puñado de nuevas empresas que trabajan en casos de uso que pueden «impulsar el impacto del mundo verdadero». Si su empresa se ajusta a estos criterios, puede solicitar el formulario completando el formulario con información básica sobre la empresa en la página web del Software Pioneers de OpenAI.

LEER Un extraño error iOS 18.4 es sorprendente a los usuarios de iPhone con instalaciones de aplicaciones aleatorias

Obtenga las principales historias de la mañana en su bandeja de entrada cada día con nuestro Boletín de Tech Today.