สรุปเนื้อหา เรื่อง Generative AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

สรุปเนื้อหา เรื่อง Generative AI for Thai Document OCR จากงานสัมมนา SCBX UNLOCKING AI (EP4)

Tónica: IA generativa para OCR de documentos tailandeses

Evento: SCBX Unlocking AI EP4, Computer Vision: Cómo la IA ve las cosas como nosotros

Colaboración: SCBX y Insiderly.ai

Lugar: SCBX NextTech, Siam Paragon, 4ª planta

Orador: Dr. Kobkrit Wiriyayuthakorn, Presidente, AIEAT y CEO de la empresa. Tecnología iApp

A pocas personas les gusta hacer papeleo porque es una tarea complicada y compleja que no fortalece nuevas habilidades en sí mismas, pero a muchas personas les debería gustar saber que el uso de la IA generativa hace que el papeleo que solía ser aburrido. Se puede completar en poco tiempo para ir a otras tareas más útiles en su lugar.

El Dr. Kobkrit Wiriyayuthakorn, presidente de AIEAT, habló brevemente sobre el tema de la IA generativa para el OCR de documentos tailandés en el seminario "SCBX UNLOCKING AI: EP4 Computer Vision: How AI See Things Like We Do" que esta tecnología de documentos se llama OCR, que significa Reconocimiento Óptico de Caracteres, que es el proceso de transformar datos, ya sean imágenes o texto, en formato analógico, en información digital que se organiza de manera ordenada.

Dr. Kobkrit Explicó que en Tailandia hemos podido utilizar la IA para ayudar a desempaquetar los datos de los documentos durante mucho tiempo desde 2018, especialmente desempaquetando los datos de las tarjetas de identificación mediante la detección de objetos o cortando grandes piezas de datos en piezas pequeñas, y luego organizando los datos de manera estructurada para saber qué partes son cuáles.

Pero en el futuro, ya no necesitaremos la detección de objetos porque podemos usar inteligencia como GPT para extraer texto OCR sin procesar y clasificarlo automáticamente en datos estructurados.

Una ventaja adicional de no utilizar la detección de objetos es que podemos admitir documentos que no tienen plantillas fijas, como recibos con varios formatos, lo que hace que Thai Document OCR sea flexible y pueda recibir nuevos documentos de inmediato.

La ventaja del OCR es que ayuda a los trabajadores a gestionar la información en documentos como cartas oficiales, presupuestos, recibos y facturas que pueden organizarse en una bonita estructura de forma rápida y ordenada. No es necesario perder el tiempo escribiendo los datos uno por uno y uno a la vez hasta el final.

Sin embargo, existe la desventaja de que el sistema GPT4 actual sigue siendo muy lento para procesar datos. Especialmente si los datos se introducen en tailandés. En promedio, se tarda entre 60 y 90 segundos en procesar, lo que puede parecer poco tiempo a primera vista, pero si tiene que manejar más de 100 hojas, significa que el costo aumentará con ello.

La buena noticia es que en Tailandia se está desarrollando la propia IA generativa de Tailandia llamada OpenThaiGPT, que es una IA que recopila conocimientos tailandeses y tiene una importante base de datos del sitio web de Pantip.

Recientemente, el equipo de desarrollo intentó tomar el examen ONET en el nivel de Grado 6 y obtener un puntaje más alto que el puntaje promedio que pueden hacer los niños tailandeses. No solo eso, sino que OpenThaiGpt también es bueno en inglés. No solo es bueno en tailandés.

Sin embargo Dr. Kobkrit Es cierto que, en el panorama general, es posible que nuestra Open AI no pueda competir con la IA en las zonas rurales, pero es una buena visión que este será un paso importante para ayudar a los tailandeses a trabajar mejor que antes, y para finales de este año, también se lanzará la versión 70b de OpenThaiGPT, que será muchas veces más inteligente.

¡Bien! A continuación, complete el pago para obtener acceso completo a The Insiderly AI.
¡Bienvenido! Has iniciado sesión correctamente.
Te has suscrito con éxito a The Insiderly AI.
¡Éxito! Su cuenta está completamente activada, ahora tiene acceso a todo el contenido.
¡Éxito! Tu información de facturación se ha actualizado.
Su facturación no se actualizó.