Inicio Tecnología ¿Qué es ChatGPT y cómo puedes usarlo?

¿Qué es ChatGPT y cómo puedes usarlo?

16 min lectura
0
546

Esto es ChatGPT y por qué puede ser la herramienta más importante desde los motores de búsqueda modernos.

OpenAI introdujo una IA de respuesta a preguntas de formato largo llamada ChatGPT que responde preguntas complejas de forma conversacional.

Es una tecnología revolucionaria porque está entrenada para aprender lo que los humanos quieren decir cuando hacen una pregunta.

Muchos usuarios están asombrados por su capacidad para proporcionar respuestas de calidad humana, lo que inspira la sensación de que eventualmente puede tener el poder de interrumpir la forma en que los humanos interactúan con las computadoras y cambiar la forma en que se recupera la información.

¿Qué es ChatGPT?

ChatGPT es un chatbot de modelo de lenguaje grande desarrollado por OpenAI basado en GPT-3.5. Tiene una capacidad notable para interactuar en forma de diálogo conversacional y proporcionar respuestas que pueden parecer sorprendentemente humanas.

Los modelos de lenguaje grande realizan la tarea de predecir la siguiente palabra en una serie de palabras.

El aprendizaje por refuerzo con retroalimentación humana (RLHF) es una capa adicional de capacitación que utiliza la retroalimentación humana para ayudar a ChatGPT a aprender la capacidad de seguir instrucciones y generar respuestas que sean satisfactorias para los humanos.

¿Quién creó ChatGPT?

ChatGPT fue creado por la empresa de inteligencia artificial OpenAI, con sede en San Francisco. OpenAI Inc. es la empresa matriz sin fines de lucro de OpenAI LP con fines de lucro.

OpenAI es famoso por su conocido DALL·E, un modelo de aprendizaje profundo que genera imágenes a partir de instrucciones de texto llamadas avisos.

El CEO es Sam Altman, quien anteriormente fue presidente de Y Combinator.

Microsoft es socio e inversionista por un monto de $1 billón de dólares. Desarrollaron conjuntamente Azure AI Platform.

Modelos de lenguaje grande

ChatGPT es un modelo de lenguaje grande (LLM). Los modelos de lenguaje grande (LLM) se entrenan con cantidades masivas de datos para predecir con precisión qué palabra viene a continuación en una oración.

Se descubrió que aumentar la cantidad de datos aumentaba la capacidad de los modelos de lenguaje para hacer más.

Según la Universidad de Stanford:

“GPT-3 tiene 175 mil millones de parámetros y fue entrenado en 570 gigabytes de texto. A modo de comparación, su predecesor, GPT-2, era más de 100 veces más pequeño con 1500 millones de parámetros.

QUIZÁ TE INTERESE  Como entrenar a tu Robot

Este aumento en la escala cambia drásticamente el comportamiento del modelo: GPT-3 puede realizar tareas en las que no fue entrenado explícitamente, como traducir oraciones del inglés al francés, con pocos o ningún ejemplo de entrenamiento.

Este comportamiento estuvo mayormente ausente en GPT-2. Además, para algunas tareas, GPT-3 supera a los modelos que fueron entrenados explícitamente para resolver esas tareas, aunque en otras tareas se queda corto”.

Los LLM predicen la siguiente palabra en una serie de palabras en una oración y las siguientes oraciones, algo así como autocompletar, pero en una escala alucinante.

Esta habilidad les permite escribir párrafos y páginas enteras de contenido.

Pero los LLM están limitados porque no siempre entienden exactamente lo que quiere un ser humano.

Y ahí es donde ChatGPT mejora el estado del arte, con el entrenamiento de aprendizaje reforzado con retroalimentación humana (RLHF) mencionado anteriormente.

¿Cómo se entrenó ChatGPT?

GPT-3.5 fue entrenado en cantidades masivas de datos sobre código e información de Internet, incluidas fuentes como discusiones de Reddit, para ayudar a ChatGPT a aprender a dialogar y lograr un estilo humano de respuesta.

ChatGPT también fue entrenado usando retroalimentación humana (una técnica llamada Aprendizaje de refuerzo con retroalimentación humana) para que la IA aprendiera lo que los humanos esperaban cuando hacían una pregunta. Entrenar al LLM de esta manera es revolucionario porque va más allá de simplemente entrenar al LLM para predecir la siguiente palabra.

Un artículo de investigación de marzo de 2022 titulado Training Language Models to Follow Instructions with Human Feedback explica por qué este es un enfoque innovador:

“Este trabajo está motivado por nuestro objetivo de aumentar el impacto positivo de los grandes modelos de lenguaje entrenándolos para que hagan lo que un grupo determinado de humanos quiere que hagan.

De forma predeterminada, los modelos de lenguaje optimizan el objetivo de predicción de la siguiente palabra, que es solo un indicador de lo que queremos que hagan estos modelos.

Nuestros resultados indican que nuestras técnicas son prometedoras para hacer que los modelos de lenguaje sean más útiles, veraces e inofensivos.

QUIZÁ TE INTERESE  Como usar Whatsapp desde la Web

Hacer que los modelos de lenguaje sean más grandes no los hace inherentemente mejores para seguir la intención del usuario.

Por ejemplo, los modelos de lenguaje extenso pueden generar resultados falsos, tóxicos o simplemente no útiles para el usuario.

En otras palabras, estos modelos no están alineados con sus usuarios”.

¿Cuáles son las limitaciones de ChatGPT?

Limitaciones en la respuesta tóxica

ChatGPT está específicamente programado para no proporcionar respuestas tóxicas o dañinas. Por lo tanto, evitará responder ese tipo de preguntas.

La calidad de las respuestas depende de la calidad de las instrucciones

Una limitación importante de ChatGPT es que la calidad de la salida depende de la calidad de la entrada. En otras palabras, las indicaciones de expertos (indicaciones) generan mejores respuestas.

¿ChatGPT es de uso gratuito?

El uso de ChatGPT actualmente es gratuito durante el tiempo de “vista previa de investigación”.

El chatbot está actualmente abierto para que los usuarios prueben y brinden comentarios sobre las respuestas para que la IA pueda mejorar al responder preguntas y aprender de sus errores.

El anuncio oficial establece que OpenAI está ansioso por recibir comentarios sobre los errores:

“Si bien nos hemos esforzado para que el modelo rechace solicitudes inapropiadas, a veces responderá a instrucciones dañinas o exhibirá un comportamiento sesgado.

Estamos utilizando la API de moderación para advertir o bloquear ciertos tipos de contenido no seguro, pero esperamos que tenga algunos falsos negativos y positivos por ahora.

Estamos ansiosos por recopilar comentarios de los usuarios para ayudar en nuestro trabajo continuo para mejorar este sistema”.

Aquí en enlace para entrar a chatgpt

Aunque si entras, dice que está a su máxima capacidad.

Fuente: searchenginejournal.com

ARTÍCULOS RELACIONADOS
Cargar más de Carlos Mestre
Cargar más en Tecnología
Comments are closed.

CHECA ESTO

Todo lo que necesitas saber sobre el Cyber Wow

Cada vez son más las personas que esperan con ilusión el Cyber Wow, un evento ideal para r…