Introducción a las Novedades de OpenAI
23 de octubre 2024
Esta semana se han presentado numerosas novedades por parte de OpenAI. En este contexto, es relevante recordar las actualizaciones recientes de Anthropic, que sorprendieron con las nuevas funcionalidades de Cloud 3.5. Sin embargo, en esta ocasión, el enfoque está en una actualización reciente de la aplicación de ChatGPT para Windows.
Esta semana hemos tenido muchas novedades por parte de OpenAI.
Actualización de ChatGPT para Windows
La reciente actualización de ChatGPT para Windows ha introducido varias mejoras significativas. Hace aproximadamente diez días, se lanzó una nueva aplicación para Windows que inicialmente no presentaba muchas novedades. Sin embargo, con la última actualización, se han incorporado características interesantes.
Si bien en otros videos, en hace diez días atrás, más o menos, veíamos el la nueva aplicación de Windows, que la descargábamos, hicimos algunas pruebas y no traía como muchas novedades, pero ahora se ha actualizado, así que esas son buenas noticias.
Detalles de la Nueva Actualización
Las pruebas realizadas indican que, aunque ChatGPT aún no puede observar el escritorio o el computador directamente, ahora es capaz de analizar imágenes. Además, se ha activado la funcionalidad de voz, permitiendo a los usuarios interactuar con ChatGPT desde su ordenador utilizando comandos de voz.
Pruebas Realizadas y Resultados
Las pruebas han demostrado que ChatGPT ahora puede acceder a documentos y realizar resúmenes de los mismos. Los usuarios pueden adjuntar archivos o imágenes, y ChatGPT puede describirlos utilizando la voz, una función que anteriormente solo estaba disponible en texto.
Limitaciones Actuales
A pesar de estos avances, la visión completa de ChatGPT aún no está disponible, lo que significa que no puede observar el escritorio en su totalidad. Sin embargo, la capacidad de leer documentos y proporcionar resúmenes con voz representa un avance significativo en la funcionalidad de la aplicación.
Funcionalidad de Voz en ChatGPT
La funcionalidad de voz en ChatGPT representa un avance significativo, especialmente para aquellos con dificultades visuales que prefieren escuchar documentos en lugar de leerlos. Aunque existen otras aplicaciones como Eleven que permiten escuchar documentos, ChatGPT ofrece la ventaja adicional de poder interactuar con los documentos mediante conversación.
«Esto es una gran avance para quienes, para aquellos que quizás tengan algunas dificultades visuales y quieran escuchar un archivo.»
La actualización reciente de la versión de escritorio de ChatGPT para Windows, lanzada el 30 de octubre, incluye esta funcionalidad de voz. Es importante destacar que esta característica está disponible en la versión de pago, conocida como versión Plus.
La interfaz de la aplicación de escritorio se ha renovado para asemejarse a la versión en línea, incorporando un buscador de chats que facilita la navegación y el acceso a conversaciones previas. Esta mejora es especialmente útil para recordar y continuar interacciones anteriores con ChatGPT.
La capacidad de buscar chats es una de las varias funcionalidades nuevas que se han introducido, junto con un portal que asesora sobre el uso de prompts, mejorando así la experiencia del usuario al interactuar con la inteligencia artificial.
Nuevas Funcionalidades de ChatGPT
En esta sección, se exploran las nuevas funcionalidades que ChatGPT ha incorporado para mejorar la experiencia del usuario. Una de las características destacadas es la funcionalidad del «slash», que permite realizar búsquedas automáticas en Internet o utilizar un modo de vista previa de manera eficiente. Esta herramienta facilita el acceso rápido a información relevante y mejora la interacción con el sistema.
Otra novedad es la incorporación de un buscador de chats, una función que muchos usuarios esperaban con ansias. Esta herramienta permite encontrar conversaciones pasadas de manera sencilla, optimizando así la gestión de información dentro de la plataforma.
«ChatGPT también incorporó un buscador aquí de de chat, lo cual yo extrañaba.»
Además, se ha mejorado el asesoramiento en el uso de prompts, ofreciendo sugerencias más precisas y adaptadas a las necesidades del usuario. Esto se complementa con la funcionalidad del slash, que agiliza las búsquedas automáticas y mejora la eficiencia del sistema.
Pruebas de Voz Avanzada en ChatGPT
Esta sección explora las pruebas de la funcionalidad de voz avanzada en ChatGPT, evaluando cómo el sistema maneja diferentes voces y su capacidad para interactuar con imágenes y documentos.
El proceso comienza con la prueba de varias voces, donde se cambia la voz para observar cómo responde el sistema. Se menciona que, en ocasiones, el sistema puede interrumpir, por lo que se silencia para evitar distracciones. Se realizan saludos y se invita a hacer preguntas, mostrando la flexibilidad de la interacción por voz.
La primera prueba importante es la capacidad de ChatGPT para ver imágenes. Se intenta cargar una imagen desde una carpeta para que el sistema la procese y la reconozca. Aunque ChatGPT no puede ver la imagen como un ser humano, puede interpretar descripciones o responder sobre su contenido si se le proporcionan detalles adicionales.
Hola, GPT, te envío una imagen. ¿La puedes visualizar, por favor?
En el ejemplo, se describe una imagen que muestra un diseño gráfico con el título «Cloud 3.5 Soner» y otros elementos destacados. Esta prueba demuestra que ChatGPT puede describir imágenes basándose en la información proporcionada, lo que es útil para verificar su capacidad de interacción visual.
La sección concluye con la preparación para una segunda prueba, que implica adjuntar documentos para evaluar cómo ChatGPT maneja la información textual y visual de manera integrada.
Interacción con Documentos y Excel
En esta sección, se explora cómo ChatGPT interactúa con documentos y hojas de cálculo Excel, destacando su capacidad para leer, resumir y analizar información.
Capacidad de ChatGPT para leer y resumir documentos
ChatGPT ha demostrado ser eficaz en la lectura y resumen de documentos. En las pruebas realizadas, el modelo fue capaz de procesar un documento y ofrecer un resumen detallado. Por ejemplo, el artículo «A Systematic Assessment of OpenAI Own Preview for Hire Order Thinking in Education» evalúa las capacidades del modelo de inteligencia artificial en comparación con el desempeño humano en tareas cognitivas de alto nivel. Este análisis destaca cómo la inteligencia artificial puede apoyar el desarrollo del pensamiento crítico y otras habilidades avanzadas en el contexto educativo.
El documento A Systematic Asessment of OpenAI Own Preview for Hire Order Thinking in Education presenta un análisis detallado de los resultados del desempeño de la IE OpenAI Own Preview.
Análisis de datos en hojas de cálculo Excel
Además de documentos, ChatGPT puede interactuar con hojas de cálculo Excel. En un experimento, se integró una planilla Excel para realizar análisis de datos. Aunque inicialmente hubo problemas al acceder a algunas columnas, el modelo logró generar estadísticas descriptivas y análisis clave, como la frecuencia de acceso a recursos de IA por parte de los estudiantes y las herramientas de IA más utilizadas.
Limitaciones actuales y potenciales mejoras
A pesar de estas capacidades, existen limitaciones. Por ejemplo, hubo dificultades al intentar acceder a ciertas columnas debido a diferencias en los nombres o espacios. Sin embargo, una vez identificados los nombres exactos, ChatGPT pudo realizar los análisis correctamente. Esto sugiere que, aunque el modelo es potente, aún hay espacio para mejoras en la interacción con datos estructurados.
Conclusiones y Futuras Actualizaciones
En esta sección, se presentan las conclusiones sobre las pruebas realizadas con las nuevas funcionalidades de ChatGPT. A pesar de algunos inconvenientes, como la imposibilidad de interrumpir el diálogo de voz, se reconoce el potencial de estas herramientas para mejorar la accesibilidad, especialmente para personas con discapacidades visuales.
Las actualizaciones recientes permiten una interacción más fluida sin necesidad de acceder a una página web específica, lo que incrementa la productividad al facilitar el uso continuo de ChatGPT para diversas tareas, como compartir y analizar documentos.
Se espera que futuras mejoras, como el modo de visión, continúen impulsando el desarrollo tecnológico y ofrezcan aún más beneficios en términos de eficiencia y accesibilidad.