Saltar al contenido
2 min de lectura Desbloqueo de SCBX IA

Resumen de Explorando el mundo de la Visión por Computador del Seminario SCBX UNLOCKING AI (EP4)

สรุปเนื้อหา เรื่อง Exploring the world of Computer Vision จากงานสัมมนา SCBX UNLOCKING AI (EP4)

Tónica: Explorando el mundo de la visión artificial

Evento: SCBX Unlocking AI EP4, Computer Vision: Cómo la IA ve las cosas como nosotros

Colaboración: SCBX y Insiderly.ai

Lugar: SCBX NextTech, Siam Paragon, 4ª planta

Ponente: Dr. Samprit Marukthatat Investigador Senior, NECTEC

ดร.สรรพฤทธิ์ มฤคทัต Senior Researcher, NECTEC
ดร.สรรพฤทธิ์ มฤคทัต Investigador Senior, NECTEC

A medida que avanza la tecnología, el poder de las computadoras y la llamada Visión por Computadora se ha ampliado, lo que facilita que cualquiera pueda navegar por el vasto mundo.

En el seminario "SCBX UNLOCKING AI: EP4" titulado "Computer Vision: How AI See Things Like We Do", el Dr. Samprit Maruktat, Investigador Senior de NECTEC, dio una conferencia sobre el tema "Explorando el mundo de la visión por computadora" para explicar cómo esta tecnología de IA de vanguardia puede ayudar a mejorar la vida de las personas. Los puntos clave son los siguientes:

  1. ¿Quieres saber para qué áreas se puede utilizar la Visión Artificial? La forma más fácil es ver películas de Hollywood como la película 'Cortina de Hierro' Terminator, donde los robots inteligentes están equipados con alta tecnología en todos los sentidos, una de las cuales es ver cosas y detectarlas y procesarlas en imágenes, o en la película Eagle Eyes, donde la inteligencia artificial intenta leer la boca de las personas para ver lo que están diciendo.
  1. Una de las cosas que la visión artificial puede facilitarnos la vida de inmediato es ayudarnos a encontrar información de diversas formas, como la búsqueda de fotos. Sólo tienes que utilizar muchos tipos de IA generativa y muchas plataformas que admitan imágenes libres de derechos de autor.

¿Qué se encuentra en estas películas? En el pasado, puede haber sido visto como poco realista. Pero ahora es real o probable que se convierta en una realidad, y no solo en estas dos películas se representa el uso de tecnología de vanguardia a través del concepto, sino que hay muchas otras tecnologías en la película que se han convertido en una realidad. Sin embargo, puede que no haya sido un avance que pueda ser ampliamente utilizado según el estilo narrativo.

  1. La visión artificial más profunda se está utilizando en muchos campos, como la medicina, que utiliza la IA para mejorar la calidad de la imagen para ayudar a los médicos a diagnosticar imágenes de rayos X con mayor precisión, hasta el uso de la IA para detectar objetos, como la detección de tumores en el abdomen. Modelado de reconocimiento 3D, reconocimiento de voz, etc.
  2. Dr. Sampharit Explique el principio de la visión del mundo de las computadoras: Las computadoras ven el mundo como píxeles. Parece un pequeño cuadrado que se coloca uno encima del otro para formar una imagen grande.
  3. El primer trabajo en utilizar la visión por computadora fue el diseño, mediante la escritura de código para ensamblar pequeñas cosas a nivel de píxel. La visión artificial comenzó en una época en la que no existía la palabra IA.
  4. Las redes neuronales se utilizan ahora en la visión artificial para ayudar a extraer automáticamente las características de los píxeles que componen la imagen.
  1. Pero a pesar de que hoy en día se puede utilizar de muchas maneras. Los retos de la visión artificial no son pocos. Si necesita crear una gran cantidad de imágenes y crear un título consistente en poco tiempo, ¿cómo controla la calidad?

Actualmente, se puede crear IA que puede trabajar tanto en imágenes como en texto, como Stable Diffusion que genera imágenes a partir de subtítulos, sistemas de subtitulado de imágenes que generan subtítulos para imágenes, sistemas de respuesta visual a preguntas que pueden responder preguntas relacionadas con imágenes y el sistema CLIP de OpenAI que ayuda a ver la coherencia entre imágenes y subtítulos.

Visual Questions Answering เป็นตัวอย่างการใช้งาน Computer Vision ที่น่าสนใจ
Visual Questions Answering es un ejemplo interesante del uso de Computer Vision.

En el campo de la medicina, como el análisis de rayos X de pulmón, se aplica el mismo principio. El sistema, es decir, la red neuronal utilizada para crear características que son adecuadas para el diagnóstico por imágenes, como radiografías de pulmón de personas normales o pacientes con COVID-19, o análisis de talasemia a partir de imágenes de portaobjetos de sangre, también utiliza la red neuronal profunda.

Es posible que las características creadas por estas redes neuronales no puedan interpretarse directamente en palabras. Como resultado, los médicos generales no aceptan el diagnóstico de estas redes neuronales.


Hoy en día, hay muchos médicos que están haciendo su propia investigación sobre la IA, y hay significativamente más conferencias de investigación sobre este tema en las conferencias de investigación médica. En comparación con hace 5-6 años, es un mecanismo importante que ha llevado a una aceptación cada vez mayor del diagnóstico por parte de las redes neuronales.

  1. Otro reto al que se enfrentan los desarrolladores es el acceso a datos con datos limitados, lo que imposibilita que los investigadores y trabajadores desarrollen un trabajo de calidad. Porque muchas veces a los que tienen información no se les permite usarla o seguir desarrollándose. Como resultado, la calidad del trabajo no es tan buena como se desea.
  2. Además, hay pocas IA que sean buenas en el idioma tailandés. En comparación con los modelos extranjeros desarrollados, esto conducirá a los desafíos básicos mencionados anteriormente, y muchos más.