Saltar al contenido
2 min de lectura Agentes de IA

Andrew Ng explora el crecimiento de los agentes de IA y el razonamiento agentico |

Explore las tendencias de los agentes de IA y los flujos de trabajo de agentes con Andrew Ng en BUILD 2024 con un nuevo concepto "Muévete rápido y sé responsable" que está cambiando el panorama de la IA de forma rápida y responsable.

ภาพชั้นต่าง ๆ ของ AI stack

La IA está cambiando el mundo a un ritmo vertiginoso, y Andrew Ng, uno de los renombrados expertos en IA, compartió sus puntos de vista y tendencias clave en la industria de la IA a través de una conferencia en COMPILACIÓN 2024 Destacó las nuevas oportunidades que surgen de los agentes de IA y las tecnologías de razonamiento agente, que son nuevos enfoques para desarrollar aplicaciones de IA potentes y rentables.

La IA es la electricidad de la era digital.

Andrew Ng compara la IA con la "electricidad de la nueva era" porque es una tecnología útil que cubre muchos aspectos, como la electricidad en el pasado. La IA es una tecnología fundamental con múltiples capas apiladas unas encima de otras, desde hardware como los semiconductores hasta infraestructura basada en la nube como Snowflake y las capas de modelos de base que han recibido mucha atención últimamente.

ภาพชั้นต่าง ๆ ของ AI stack

Sin embargo, lo que es importante y a menudo se pasa por alto es la capa de aplicación, que creará valor e ingresos para la tecnología que se encuentra debajo. Por lo tanto, el desarrollo de aplicaciones de IA es el área con mayor oportunidad para crear nuevas innovaciones.

Desarrollo de IA más rápido con IA generativa

Una tendencia notable en los últimos años ha sido el desarrollo de modelos de IA mucho más rápidos. IA generativa Eso permite la creación de aplicaciones en un tiempo significativamente más corto.

Por ejemplo, crear un clasificador de opinión que se utiliza para comprobar la opinión de los textos. En lugar de meses de preparación de datos, modelos de entrenamiento e implementación. Actualmente, esto se puede hacer en solo unos días escribiendo el mensaje correcto e implementándolo de inmediato.

การพัฒนา sentiment classifier ที่รวดเร็วขึ้นด้วย generative AI

Este rápido desarrollo brinda a los equipos de IA la oportunidad de experimentar con la creación masiva de prototipos en un corto período de tiempo, como crear 20 prototipos durante el fin de semana y luego seleccionar solo los que funcionan mejor. Se trata de un cambio en la forma de pensar, pasando de una planificación anticipada a largo plazo a una rápida experimentación y mejora.

Nuevos Desafíos: Evaluación y Desarrollo de Aplicaciones

Aunque el entrenamiento de modelos es mucho más rápido, las evaluaciones, también conocidas como evaluaciones, se han convertido en un cuello de botella importante porque en las aplicaciones que usan modelos de lenguaje grandes (LLM), a veces no se necesitan muchos datos de entrenamiento. Pero requiere una gran cantidad de datos de prueba para mayor precisión y confiabilidad.

Por lo tanto, el proceso de reurbanización se convierte en la creación y el almacenamiento de datos en paralelo. En lugar de seguir el mismo orden. Además, hay muchas etapas de la creación de aplicaciones, como el diseño del producto, la integración y el cuidado posterior a la implementación, que no son tan rápidas como el desarrollo de modelos de IA.

La creciente velocidad del entrenamiento de modelos está obligando a las organizaciones a acelerar el desarrollo de otras áreas para permitir el uso comercial efectivo de la IA.

Nuevo concepto: "Muévete rápido y sé responsable"

En el pasado, había un eslogan "Muévete rápido y rompe cosas" que enfatizaba la aceleración de la experimentación a pesar de que pueden ocurrir errores, pero este eslogan fue visto negativamente porque causaba consecuencias negativas. Sin embargo, Andrew Ng sugiere que la idea correcta en esta era es " Muévete rápido y sé responsable "Es un desarrollo rápido, pero hay que tener en cuenta la responsabilidad. No suelte artículos que puedan causar daños al público.

Los equipos de desarrollo de IA inteligente pueden crear prototipos, revisar y probar exhaustivamente de forma rápida y segura antes de lanzarlos a producción, lo que está siendo emocionante y está cambiando drásticamente la industria de la IA.

Tecnologías a tener en cuenta: Flujos de trabajo de IA agentic

Una de las tendencias que más le interesa a Andrew Ng es " IA agentica o diseños de IA que ejecutan agentes y procesos de razonamiento con múltiples pasos (flujos de trabajo agenticos), lo cual es diferente del uso de grandes modelos de lenguaje tradicionales llamados "Agentes". Aviso de disparo cero

en Aviso de disparo cero Simplemente ordenamos al modelo que responda a una pregunta o escriba contenido de una sola vez, como escribir un ensayo de principio a fin sin editar en el camino.

เปรียบเทียบ zero-shot prompting กับ agentic workflows

Por otro lado, un flujo de trabajo agentico funciona en etapas, como comenzar con un boceto de la trama, investigar más información, revisar el borrador original y repetir estos pasos varias veces hasta que se logre un resultado de mayor calidad.

Algunos ejemplos de aplicaciones de IA agentica son el análisis de documentos jurídicos complejos. Esto puede mejorar en gran medida la eficiencia y la precisión.

Hay 4 principios de diseño principales de los flujos de trabajo agenticos.

  1. Reflexión : Deje que el modelo revise y critique su propio trabajo, como escribir código y, a continuación, hacer que el modelo compruebe si hay errores y los corrija para mejorar.
  2. Utilizar : Deje que el modelo decida ejecutar API u otras funciones, como la búsqueda web, enviar correo electrónico o administrar programaciones de citas.
  3. Planificación : Permita que el modelo planifique una secuencia de flujo de trabajo, como la creación de una imagen separando primero los pasos de detección de gestos, creación de una imagen, descripción de la imagen y, por último, creación de efectos de sonido.
  4. Colaboración multiagente : Proporcionar modelos que simulen múltiples roles, como codificadores y críticos, que trabajen juntos para reducir errores y mejorar la calidad del trabajo.
ตัวอย่าง reflection design pattern ใน agentic workflows

Estos patrones permiten a los desarrolladores crear rápidamente sistemas más complejos y eficientes.

La llegada de los grandes modelos multimodales (LMM) y la IA visual

Además del gran modelo de lenguaje, Desarrollo de modelos que admitan varios formatos de datos, como imágenes, vídeo y audio, también conocidos como Grandes modelos multimodales (LMM) Es una tendencia a tener en cuenta.

Estos modelos pueden procesar mejor los datos visuales y de vídeo cuando se utilizan flujos de trabajo de agentes, como contar jugadores en un campo de fútbol a partir de fotos o extraer clips de vídeo de hitos, como marcar un gol en un partido de fútbol.

นับจำนวนผู้เล่นในสนามฟุตบอลด้วย visual AI agent

Un ejemplo de demostración demostrado por Andrew Ng y el equipo de Landing AI es el uso de un agente de visión para escribir automáticamente código de análisis de imágenes y vídeos, lo que facilita a las empresas con grandes cantidades de datos de imagen y vídeo el uso de esos datos.

ตัวอย่างการวิเคราะห์คลิปวิดีโอหาช่วงเวลาการทำประตู

También es posible crear metadatos a partir de vídeos, como dividir clips en ráfagas cortas, con narración y datos en formato tabular para su posterior búsqueda y análisis.

โค้ดสำหรับจัดการข้อมูลวิดีโอและเมตาดาต้า

Beneficios y oportunidades de la IA agentica en los negocios

Con las capacidades de la IA agentica y la IA visual, las empresas con datos no estructurados, como texto, imágenes y vídeos, pueden crear más valor.

Por ejemplo, la búsqueda de clips de vídeo con eventos específicos. Anteriormente, el seguimiento de objetos en vídeos o el análisis de imágenes en diferentes entornos eran difíciles y requerían mucho tiempo.

การค้นหาคลิปวิดีโอตามคำค้นหาเฉพาะ

Además, es mucho más fácil y rápido crear estas aplicaciones. Esto permite a los equipos pequeños innovar sin una gran inversión.

Una visión general de las tendencias clave en IA a las que hay que estar atentos

Andrew Ng describe cuatro tendencias clave que están impulsando la IA:

  1. Aceleración de la creación de tokens Porque los flujos de trabajo de agentes tienen que leer y generar una gran cantidad de texto. Esto llevó al desarrollo de tecnologías de hardware y software para aumentar la eficiencia.
  2. Modelos de lenguaje de gran tamaño entrenados para producción (para usar) Más que responder a una pregunta general, como Anthropic, que lanzó un modelo que soporta el uso de ordenadores reales.
  3. La importancia de la ingeniería de datos con datos no estructurados Por ejemplo, el texto, las imágenes y los vídeos están aumentando en volumen y deben gestionarse de forma eficaz para crear valor.
  4. La revolución del procesamiento de imágenes está llegando. Aunque el procesamiento de textos ya está muy extendido, el procesamiento de imágenes está entrando en pañales y creará muchas nuevas oportunidades.
สรุปเทรนด์สำคัญของ AI

Conclusión de Insiderly

Esta es una oportunidad de oro para que los desarrolladores de IA experimenten e innoven más rápido que nunca, con IA generativa que reduce el tiempo de desarrollo e IA agentiva que amplía el alcance de las capacidades del modelo para que sea más complejo y flexible. La aparición de los grandes modelos multimodales nos ha permitido gestionar los datos de imagen y vídeo de forma más eficiente.

El desarrollo de flujos de trabajo agenticos no solo mejora la calidad del trabajo de IA, sino que también transforma la forma de pensar en el diseño de sistemas en un proceso que se planifica, analiza y mejora continuamente, que es la clave del éxito en el mundo de la IA que cambia rápidamente.

último La gestión de datos no estructurados y la creación de aplicaciones rápidas y responsables se convertirán en el núcleo de las organizaciones que buscan utilizar la IA para crear valor real y transformar las empresas.

Para aquellos que estén interesados en experimentar. Demostraciones visuales de IA Creado por Andrew Ng y el equipo de IA de Landing. Puedes visitar va.landing.ai para probarlo y ver ejemplos de código de inmediato.

Términos técnicos que debes conocer