¿Alguna vez te has preguntado por qué la IA a veces responde a las preguntas equivocadas o te da información poco razonable?
Este problema está a punto de desaparecer porque investigadores de Alibaba y la Universidad de Ciencia y Tecnología de China han desarrollado una nueva IA llamada START (Self-Taught Reasoner with Tools).
START no es solo una IA ordinaria, sino que es una IA que piensa paso a paso y sabe cómo usar herramientas de pensamiento, al igual que usamos calculadoras o programas de computadora para resolver problemas difíciles.
¿Cómo funciona START? ¿Qué hace que START sea diferente?
START es una IA que se basa en el concepto de Grandes Modelos de Razonamiento (LRM) o grandes modelos de lenguaje que se centran en el razonamiento.
- Cadena de pensamiento (CoT): Piensa sistemáticamente en etapas:
- START utiliza un método llamado "Cadena de Pensamiento", que consiste en descomponer problemas complejos en pequeños pasos y resolverlos gradualmente paso a paso. Esto permite analizar y abordar mejor problemas complejos. Es como cuando resolvemos problemas matemáticos difíciles, tenemos que hacerlo paso a paso.
- Uso de herramientas externas: Intérprete de Python:
- Cuando se enfrenta a un problema que requiere cálculos complejos o necesita más información, START ejecuta un programa Python para ayudar a calcular, examinar datos o generar el resultado deseado. Esto permite obtener respuestas precisas y confiables. Es como tener una calculadora inteligente y un asistente para analizar datos personales.
- Aprendizaje autodidacta: Aprende y mejórate a ti mismo:
- START tiene un sistema que le ayuda a aprender de su propia experiencia y a mejorar sus habilidades de razonamiento y herramientas, al igual que practicamos problemas repetitivos hasta que mejoran.
- Utiliza técnicas denominadas Hint-infer y Hint Rejection Sampling Fine-Tuning (Hint-RFT), que permiten que el modelo aprenda a utilizar eficazmente herramientas externas. No requiere una gran cantidad de datos de muestra.
Mecanismo START
(Un poco técnico, puedes omitirlo).

Ilustración del funcionamiento de START a partir del trabajo de investigación
START funciona a través de dos procesos principales:
- Sugerencia-inferencia :
- En esta etapa, START inserta "sugerencias" (sugerencias). en el proceso de razonamiento para animar al modelo a ejecutar herramientas externas.
- Un ejemplo de una sugerencia como "Espera, tal vez usar Python aquí sea una buena idea".
- Ajuste fino de muestreo de rechazo de sugerencias (Hint-RFT) :
- En este paso se utilizan los resultados de Hint-infer para seleccionarlos, puntuarlos y refinarlos para crear un conjunto de datos de alta calidad (DSEED).
- A continuación, se toma la dseed para ajustar el modelo base (QwQ-32B-Preview) para crear un START-0.
- START-0 se utilizará para crear un conjunto de datos más completo (DSTART), lo que conducirá a un ajuste final para crear un START.
¿Qué tan bueno es START? Ejemplos de talentos asombrosos
START no solo es "bueno", sino "muy bueno".
Echemos un vistazo a algunos ejemplos de las increíbles capacidades de START.
- Resolver problemas matemáticos competitivos:
- START obtiene puntuaciones altas en competiciones de matemáticas de alto nivel como MATH500 y AMC23, con una precisión del 95% en algunas competiciones, que es más alta que la de muchos estudiantes de élite.
- Responder a las preguntas de la tesis doctoral:
- START puede responder con precisión a preguntas difíciles y complejas a nivel de doctorado. En la prueba GPQA (Graduate-Level Science Questions), START obtuvo una puntuación significativamente mejor que las generaciones anteriores de IA.
- Código informático y depuración :
- START no es solo código de programación, sino también programación. Pero también pueden comprobar y corregir errores en su código por su cuenta, lo cual es una habilidad muy importante en el desarrollo de software.
Lo que es aún más sorprendente es que START puede hacer estas cosas sin que se le diga cada paso.
Sorprendentemente bueno (secretamente asustado un poco 😆)
Tecnología detrás de START: QwQ-32B-Vista previa y ajuste fino
START se basa en el modelo QwQ-32B-Preview, un modelo de lenguaje grande (LLM) altamente eficiente que utiliza Python como una herramienta importante para ayudar a pensar y procesar datos.
START también utiliza un proceso de ajuste fino de dos fases para ajustar el modelo y mejorar el razonamiento y las herramientas.
¿Cómo cambiará START nuestro mundo? Potencial de aplicación
START tiene el potencial de revolucionar y transformar nuestro mundo de muchas maneras, tales como:
- Investigación científica:
- START puede ayudar a los científicos a analizar datos complejos, encontrar relaciones ocultas o incluso ayudar a inventar nuevas teorías de manera efectiva.
- Educación:
- START se puede utilizar para desarrollar materiales de aprendizaje inteligentes y personalizados para cada alumno. Facilita la comprensión de contenidos difíciles.
- Desarrollo de Software:
- START puede ayudar a los programadores a escribir código, comprobar si hay errores y optimizar sus programas, haciendo que el desarrollo de software sea más rápido y eficiente.
- Soluciones complejas:
- Ya sea que se trate de análisis de datos financieros, planificación de estrategias comerciales o gestión logística, START puede ayudarnos a tomar mejores decisiones y resolver problemas complejos de manera efectiva.
El futuro de la IA que "piensa" no es solo "recordado"
START no es una IA cualquiera, sino un gran avance en el campo de la tecnología de inteligencia artificial. Demuestra que la IA realmente puede "pensar", no solo recordar información para responder.
Aunque START todavía tiene algunas limitaciones, como la capacidad de trabajar con lenguajes distintos a Python.
Pero también abre la puerta a un nuevo mundo de IA que es más inteligente, más sensible al contexto y está lista para ayudar a los humanos a resolver problemas más complejos en el futuro.
Quién sabe, en los próximos años, puede que veamos una IA que pueda interactuar y razonar como un humano real.
START podría ser el comienzo de una gran revolución en IA que cambiará nuestro mundo para siempre.