Sesión 1: Hoja de ruta de ACL y LLM en Tailandia

SCBX Unlocking AI está de vuelta en EP 9 bajo el tema Avanzando en el desarrollo y las aplicaciones de ThaiLLM para presentar historias sobre IA y LLM que han estado en la atención de personas de todo el mundo desde el nacimiento de ChatGPT.
Este evento tiene muchos temas de discusión interesantes. El Dr. Thepchai Sapnithi, Vicepresidente de AiAT y Director de Investigación de Inteligencia Artificial del Centro Nacional de Tecnología Electrónica e Informática (NECTEC) dio una conferencia sobre la hoja de ruta de ACL y LLM en Tailandia.
Pero antes de explicar sobre los LLM, el Dr. Thepchai primero presentó lo que se llama ACL y lo importante que es para el mundo de la IA y el LLM.
ACL tiene 2 significados de la siguiente manera:

- La Reunión Anual de Lingüística Computacional es una conferencia académica de lingüistas informáticos, que se celebra desde 1962, pero originalmente se llamaba Asociación de Traducción Automática y Lingüística Computacional.
- Asociación de Lingüística Computacional o quienes supervisan y organizan esta conferencia. Si este evento y los organizadores están ausentes, puede resultar en el despertar en el campo de la IA cambiando del frente de la mano al dorso de la mano.
El Dr. Thepchai agregó que las conferencias de ACL siempre se han realizado en los Estados Unidos hasta 1996, cuando comenzaron a celebrarse en otros países, como Canadá y España, antes de que se celebrara la primera conferencia asiática en Hong Kong en el año 2000.
Y en agosto de 2024, Tailandia también acogerá la reunión. Él mismo también asistirá al evento. Después de participar en la ACL desde 2009.
La razón es que la llegada de ChatGPT en unos años también ha dado lugar a LLM multilingües de Google, Microsoft, Meta, Apple y OpenAI, que se centran en el inglés.
Tailandia también tiene LLM tailandeses como OpenThaiGPT y Typhoon, etc.

El Dr. Thepchai también dijo que Tailandia ha establecido una hoja de ruta con cinco planes de acción de IA, con la estrategia de LLM también en el segundo aspecto, lo que demuestra que Tailandia concede gran importancia a este tema y debería ser útil para el uso comercial o la investigación futura.
A estas alturas. Él y el equipo de NECTEC han recibido muchas solicitudes tanto de agencias gubernamentales como privadas para ayudar a crear LLM con campos específicos para ayudar con tareas específicas para cada organización. Debemos seguir vigilando cómo se desarrollará y utilizará.
Otra tarea importante es aunar esfuerzos con la Agencia Nacional de Investigación (ANR). El Ministerio de Educación Superior, Ciencia, Investigación e Innovación y el Ministerio de Economía y Sociedad Digital para crear 3 modelos de LLM:

- El LLM preentrenado es un modelo base versátil para usar el idioma tailandés que puede ser compartido por todos.
- Modelo de puesta a punto para apoyar el turismo Medicina y Medio Ambiente
- Un modelo de código abierto que las organizaciones privadas pueden utilizar para desarrollarlo y extenderlo a otras industrias en las que trabajan.
Otra cosa que se está haciendo es el Chatbot Arena o llevar a cada chatbot a hablar entre sí para saber qué información del bot es correcta. Fácil de usar ¿Más práctico?
Otra cosa que enfatizó el Dr. Thepchai es que el uso de la IA debe ser seguro y confiable, así nació el proyecto de desarrollo Trustworthy AI Framework. Ya sea que viole la ley, la obscenidad, sea amigable con la salud mental y sea bueno para la sociedad y la cultura tailandesa, etc.
último El Dr. Thepchai también expuso la hoja de ruta que NECTEC ha planeado aproximadamente que dentro de los próximos 5 años, se desarrollará más OpenThaiGPT, y en 2028, OpenThaiLLM y OpenThaiLLM Multimodel versión 3.0.0 se desarrollarán para el trabajo de Instrucción Mundial 3D.
Si todo sale según lo planeado, Estamos seguros de que veremos muchos más desafíos, novedades y cosas emocionantes suceder en Tailandia.
Sesión 2: Avanzando en la investigación y el desarrollo de LLM en el sudeste asiático: Tendiendo puentes entre la innovación y la colaboración

De donde hay una barrera idiomática en este mundo. Comunicarse con extranjeros requiere conocimiento y experiencia durante mucho tiempo. Pero la llegada de la IA generativa y el rápido desarrollo de los LLM han roto las barreras lingüísticas.
Hasta ahora, no solo en Estados Unidos o Europa se están desarrollando LLM inteligentes y de vanguardia, sino que en Asia, especialmente en el sudeste asiático, también se están desarrollando.
ศ.ดร.สรณะ นุชอนงค์ Director of VISTEC-depa หนึ่งในผู้บุกเบิกด้าน LLM ในไทย มาบรรยายเรื่อง Advancing LLM R&D in Southeast Asia: Bridging Innovation and Collaboration ในงาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications para explicar cuánto está progresando la educación, la investigación y el desarrollo de LLM en el sudeste asiático.

Uno de los proyectos más destacados se encuentra en Singapur. Llamado SEALD (Southeast Asian Languages in One Network Data), o simplemente conocido como AI Singapore, es un proyecto que invita a investigadores de países vecinos a colaborar para crear LLM que se destaquen en los idiomas locales de Asia.
Esto se debe a que todos los países del sudeste asiático ya tienen su idioma principal. No solo eso, hay miles de dialectos o lenguas secundarias. El proyecto tiene como objetivo desarrollar Los LLM con información sobre los diferentes idiomas de la región se consideran un buen uso de la diversidad.
Sin embargo Si los investigadores van a investigar y desarrollar LLM de manera efectiva, también deben tener buenas mediciones, pero el problema con el desarrollo de LLM hoy en día es que todavía es difícil de medir. No solo en Asia, sino que incluso los propios LLM de inglés todavía tienen este problema.
El Prof. Dr. Sarana explicó que existen 4 obstáculos principales para medir los resultados de la siguiente manera:

- Datos de evaluación dispersos: solo menos de 10 idiomas han sido desarrollados y entrenados por la IA.
- Brecha de recursos: de los 1.308 idiomas en el sudeste asiático, 700 tienen solo 1 o 2 conjuntos de datos que son precisos para la medición.
- Calidad de los recursos No se ha confirmado que la calidad de la información en Internet sea lo suficientemente precisa como para ser utilizada en el futuro.
- Relevancia cultural La información o la terminología sobre múltiples idiomas secundarios traducidos del inglés pueden no corresponder a la cultura o el contexto real del área.
El gobierno de Singapur entiende bien este problema, por lo que ha desarrollado el proyecto SEACrowd para recopilar oficialmente conjuntos de datos de países del sudeste asiático, y los investigadores de Vistec también participan en el proyecto.
El Prof. Dr. Sarana espera que SEACrowd sea un buen punto de referencia que ayude a garantizar que los datos obtenidos realmente presenten la región del sudeste asiático, no solo pensando en ella o traduciéndola de fuentes occidentales.

Porque no hay que olvidar que el desarrollo de LLM se mide con el punto de referencia adecuado. Práctico. Ayudará a guiar a los investigadores hacia sus objetivos y les permitirá saber qué problemas deben resolverse. No es necesario resolver ningún problema. Lo que ayudará a desarrollar LLM para ser mejor en el futuro, etc.
Pero también hay que medir las precauciones. El Prof. Dr. Sorana dio un ejemplo de un artículo llamado Don't Make Your LLM an Evaluation Benchmark Cheater que concluyó que se debe tener cuidado al medir deliberadamente los resultados para producir números atractivos. Se ve más hermoso, pero no se puede usar en la práctica cuando se trata de trabajo real porque no es diferente de un estudiante que tiene la intención de leer un libro para obtener una buena puntuación en un examen, pero no puede usar el conocimiento que ha adquirido para ninguna ventaja.
En cuanto al futuro. El Prof. Dr. Sorana afirmó que Tailandia continuará cooperando con el proyecto SEACrowd para llevar el idioma tailandés a la base de datos central para que el mundo sepa más.
Sesión 3: Comprensión de las incrustaciones textuales: aplicaciones en la recuperación y recomendación

¿Alguna vez te has preguntado cómo los sitios de publicación de empleos como JobTopGun pueden ayudar a los solicitantes de empleo a conseguir el trabajo adecuado? La respuesta está en el SCBX Unlocking AI EP 9: ¡Avanzando en el desarrollo y las aplicaciones de ThaiLLM!
El Dr. Ekpol Songsuwanich del Departamento de Ingeniería Informática de la Facultad de Ingeniería de la Universidad de Chulalongkorn, dio una conferencia sobre Understanding Textual Embeddings: Applications in Retrieval and Recommendation y compartió su experiencia en la práctica y el desarrollo de LLM.
El Dr. Ekpol dijo que los seres humanos tenemos la capacidad de interpretar, sabemos qué oraciones tienen el mismo significado o están cerca de qué oraciones, como Una niña parece estar muy triste, que tiene un significado similar a La niña está lejos de ser feliz.

Sin embargo, al desarrollar LLM, también es un desafío ingresar información para que la computadora entienda el significado de las oraciones que se escriben de manera diferente. Pero el significado es el mismo o similar.
El Dr. Ekpol dio un ejemplo de cómo solía entrenar el sistema de JobTopGun, un sitio web de búsqueda de empleo que permite a las personas subir sus currículums al sitio web. Su trabajo es hacer lo que sea necesario para encontrar una manera de hacer coincidir los currículums para encontrar el puesto de trabajo adecuado.
Por lo tanto, entrenó a la inteligencia artificial para leer el currículum del solicitante de empleo y la descripción del puesto de trabajo de cada trabajo de cada organización hasta conocer las características laborales adecuadas de cada persona.
Para las técnicas de aprendizaje que enseñan la inteligencia artificial, existen 2 géneros: Incrustaciones dispersas y Incrustaciones densas.

- Las incrustaciones dispersas se refieren a que el aprendizaje automático lea un libro y cuente cuántas palabras clave tienen estos libros, como el libro de William Shakespeare. Cuántas palabras hay para Battle o cuántas palabras hay para Soiler, etc., y luego analice los resultados de las ventajas de Sparse Embeddings, que son fáciles de usar. Por ejemplo, en algunos casos, es posible que no encuentre la palabra que desea contar y, a menudo, la computadora puede pasar por alto palabras que tienen el mismo significado pero no son la misma palabra. Por lo tanto, puede ser necesario cambiar de contar el número de veces a contar porcentajes o frecuencia en lugar de la frecuencia con la que se encuentra con esta palabra.
- Incrustaciones densas: Entrada para el aprendizaje profundo y luego convierta las cosas en números. Si algún número es igual o similar. El Dr. Ekpol compartió que así es como enseñó el aprendizaje automático de JobTopGun para aprender a leer el currículum de un candidato a un puesto de trabajo. Indica que el currículum vitae del solicitante de empleo es adecuado para el puesto que está abierto a la solicitud.
Tanto las incrustaciones dispersas como las densas tienen sus propias ventajas y desventajas. Antes de usarlo, debe ver qué casos deben usar Disperso, qué casos deben usar Denso o si deben usarse juntos para sacar lo mejor de ambos métodos.

Solo hay que entender el concepto y cómo funciona. El Dr. Ekpol confía en que seremos capaces de desarrollar muchas cosas interesantes. Seguir mejorando el trabajo de ellos mismos y de la organización.
Sesión 4: Investment Insights Unleashed: RM digital impulsado por IA y servicio al cliente

Personas que serán inversores exitosos Es indispensable mantenerse al día con las noticias en todo momento, pero debido a que la información de esta época llega tan rápido que es difícil mantenerse al día. Perderse un poco de información importante puede resultar en grandes pérdidas en un abrir y cerrar de ojos, en lugar de obtener ganancias.
Pero, ¿qué pasaría si los inversores tuvieran un acceso más fácil a la información que necesitan para invertir? El Sr. Veerint Itroj, Líder de Transformación de IA de InnovestX, proyectó la imagen en una conferencia titulada "Investment Insights Unleashed: AI-Powered Digital RM and Customer Service" en SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications.
El Sr. Veerint dijo que InnovestX tiene actualmente una base de clientes de alrededor de 1 millón de personas, pero la mayoría de ellos, alrededor del 98%, son clientes generales que tienen relativamente poco tiempo para invertir porque tienen que trabajar a tiempo completo y no hay nadie que les asesore sobre qué acciones comprar y cuáles vender. Hay que dedicar tiempo al trabajo para seguir las noticias de diversas fuentes.
Y porque la inversión actual no es solo acciones tailandesas, sino también acciones extranjeras. Hay fondos mutuos, bonos y bonos para elegir, así como activos de riesgo como las criptomonedas. ¿Cuánto afecta a nuestra propia cartera de inversiones?

Otro desafío es que los clientes a menudo se comunican con InnovestX para consultar información de inversión a través de múltiples canales, lo que hace que el servicio al cliente tenga que trabajar especialmente duro para recibir información de los clientes.
Al mismo tiempo, es difícil desarrollar profesionales de la inversión humana. Trabaje para mantenerse al día con el creciente número de clientes.
A partir de los casos acumulados, se desarrolló el desarrollo de RM Digital Powered AI a través de un LLM llamado Typhoon para ayudar a los empleados de InnovestX en su trabajo y ayudar a los clientes de la plataforma a acceder a la información de inversión que mejor se adapte a sus necesidades.

En el servicio al cliente, InnovestX utiliza la IA para ayudar con el servicio al cliente, que es un chatbot para brindar servicios de apertura de cuentas o responder preguntas básicas de inversión, lo que reduce el problema de la sobrecarga de información, reduce el tiempo de trabajo y hace que los expertos humanos se encarguen solo de los casos importantes. El subproducto también reduce el error humano y ayuda a los empleados a no estresarse ni cansarse demasiado.
Los datos utilizados por el LLM de InnovestX se tomarán del análisis preparado por el equipo de análisis de InnovestX, y cada documento tendrá una referencia a la fuente de los datos utilizados para que los inversores puedan leer más si tienen tiempo, lo que ayudará a aumentar la credibilidad y tranquilizará a los inversores de que los analistas no hacen sus propios cálculos sin principios o pruebas.
No solo eso, sino que el uso del modelo de Typhoon también ha ayudado a InnovestX a ahorrar más del 10% de su presupuesto en comparación con el uso de otros modelos como GPT4o, y los empleados pueden responder a los clientes más rápido. Ahorre más tiempo y tenga más confianza en que puede ofrecer rápidamente asesoramiento de inversión de calidad a sus clientes.

En el evento, SCBX Unlocking AI también demostró el uso de RM digital impulsado por IA en tiempo real, demostrando cómo funciona la IA de InnovestX. Cómo responder a la información que los clientes realmente ingresan para crear una buena sensación para los clientes que usan el servicio, de modo que puedan continuar invirtiendo feliz y exitosamente.
Si alguien está interesado, quiero saber si la información de inversión de InnovestX es realmente confiable y confiable. Puedes intentar chatear con InnovestX.
Sesión 5: Avance de los LLM tailandeses y sus aplicaciones

งาน SCBX Unlocking AI EP 9: Advancing ThaiLLM Development and Applications นอกจากอัดแน่นไปด้วยการบรรยายถึง LLM ในแง่มุมที่น่าสนน��นืน่าสนนืานนนแงุมุน่มุน่าสนนนแง่มุนุ่นน่าสนนฏแงุุนุนนนีน่าสนแงุุุนนฏแุุนุุุฏุุฏุุาุุฏุุาุุฏาุาุณาุฏาุารารรารรบรรร��จ ยังมีการเสวนาปิดท้ายด้วย ชื่อเดียวกับธีมงานเลยนั่นคือ Avanzando en los LLM tailandeses y sus aplicaciones
El evento contó con la participación de profesionales con experiencia en el estudio y desarrollo de LLMs a nivel nacional y global. El Dr. Thepchai Sapnithi, Vicepresidente de AiAT y Director de Investigación de Inteligencia Artificial de NECTEC, la Prof. Dra. Sarana Nuchonong, Directora de VISTEC-depa, el Dr. Ekpol Songsuwanit del Departamento de Ingeniería Informática de la Facultad de Ingeniería de la Universidad de Chulalongkorn, y la Sra. Veerin Itroj, Líder de Transformación de IA de InnovestX.
Con Dr. Thitipat Achakulvisut El profesor del Departamento de Ingeniería Biomédica de la Facultad de Ingeniería de la Universidad de Mahidol fue el maestro de ceremonias.
¿Cuáles son los puntos interesantes de esta discusión? Insiderly ai lo ha resumido de la siguiente manera:

- El Sr. Veerint dijo que el LLM se puede utilizar en muchos campos financieros. Además de procesar información para ayudar con la inversión. También se puede utilizar para ayudar a resolver las deudas incobrables de los consumidores, reducir costos, reducir riesgos y ayudar a mejorar la experiencia del cliente, etc.
- El Dr. Ekpol dijo que el LLM se puede utilizar en muchos campos académicos para cuidar mejor a los estudiantes, y dio un ejemplo de que el número de estudiantes en la facultad ha aumentado muchas veces, pero el número de profesores no ha aumentado en la misma proporción. Así que experimentó con el uso de LLM para ayudar con el trabajo, como la revisión de exámenes.
- Sin embargo, cuando intenté revisar la prueba, descubrí que el LLM no daba respuestas muy precisas en comparación con el autoexamen humano. Si se usa, puede hacer que las calificaciones del estudiante se extravíen. Por lo tanto, es algo que hay que vigilar para ver cómo en el futuro se puede desarrollar un sistema con precisión que ayude al trabajo y alivie la carga del profesorado.
- El Dr. Thepchai agregó que NECTEC también usa LLM, pero se usa para tareas simples como usarlo como un chatbot para responder preguntas sobre las regulaciones corporativas, como vacaciones, licencias y beneficios para los empleados. Se pueden incluir escenarios complejos como variables para probar qué tan bien pueden responder preguntas que han cambiado de lo que han aprendido.
- El Prof. Dr. Sarana agregó que actualmente está ayudando a la Facultad de Derecho de la Universidad de Thammasat a capacitar a LLM para actuar como asistente legal, pero la razón por la que no se capacita para ser abogado es porque aún no confía y confía plenamente en sus respuestas que son más precisas o iguales al diagnóstico de casos humanos. Como resultado, el papel de los LLM como asistentes legales ahora se limita a ayudar a encontrar información. Se espera que para septiembre, se publique una demostración de su uso para que todos la vean.
- Otra cosa que el Prof. Dr. Sarana enfatizó es: La gente todavía tiene la idea errónea de que podemos usar LLM como una base de datos para buscar información, lo cual no es porque no olvidemos que la información obtenida sigue siendo inexacta y errónea a partir de los hechos. Si alguien quiere usarlo como una base de datos, debe ser realmente competente, debe saber si la información que proporciona es correcta o incorrecta, y siempre debe verificar su información.
- El Dr. Thepchai dijo que es importante tener un buen LLM que brinde información precisa. También es necesario aprender buena información básica. Sin embargo, admite que actualmente solo hay unas pocas personas que pueden practicar LLM y afinar las respuestas según lo previsto, por lo que si queremos que el campo de la IA se desarrolle más, es necesario acelerar el desarrollo de personal para ayudar a mejorar la industria.
- En el caso de InnovestX, es difícil encontrar personas que complementen el equipo de ingenieros de IA. En comparación con otros países que están en una tendencia alcista. Esto hace que la gente esté menos interesada en la información de las acciones tailandesas. La cantidad de dinero que apoyará el crecimiento de la industria también es menor. No se puede desarrollar de manera efectiva.
- El problema de las personas también hace que la comunidad de personas en la industria del desarrollo de IA no sea tan fuerte como debería ser. El Dr. Ekpol dijo que había conocido a personas de muchas organizaciones que intentaron estudiar y desarrollar LLM por su cuenta, pero cuando tuvieron que aprenderlo ellos mismos, fue costoso y tuvieron que pagar una tarifa de prueba y error muy cara. Eso le hace ver la importancia de una discusión como SCBX Unlocking AI que puede unir a las personas que están interesadas en las mismas cosas y conducir a mejores cosas al mismo tiempo. Y deberíamos tener más espacio como este. Si realmente quieres que el campo de la IA evolucione, tienes que cambiarlo.