Todas las Noticias en Películas, Avances de Películas y Reseñas.

Cicero AI de Meta logra un rendimiento a nivel humano en el juego de mesa Diplomacy

En el conocido juego de mesa Diplomacy, Meta Cicero AI era capaz de desempeñarse a un nivel comparable al de un humano. Hace uso de un modelo similar a GPT-3.

Meta AI reveló la creación de Cicero el martes, que afirma que es la primera IA en actuar a nivel humano en el juego de mesa estratégico Diplomacia. Es un logro digno de mención, dado que el juego requiere fuertes habilidades de negociación interpersonal y que Cicero debe tener un cierto nivel de habilidad lingüística para prevalecer.

Los juegos de mesa han servido durante mucho tiempo como una medida eficaz del desarrollo de la IA, incluso antes de la victoria de Deep Blue en 1997 sobre Garry Kasparov en el ajedrez. Cuando AlphaGo derrotó al maestro de Go Lee Sedol en 2015, se rompió otra barrera. Ambos juegos se adhieren a un conjunto de reglas analíticas que son razonablemente explícitas (sin embargo, las reglas de Go generalmente se modifican para la IA de la computadora).

Meta Cicero AI está cerca de un rendimiento de nivel humano en un juego de mesa llamado Diplomacia

Sin embargo, un elemento importante de la jugabilidad en Diplomacy requiere habilidades sociales. Para tener éxito, los jugadores deben demostrar empatía, hablar con naturalidad y desarrollar relaciones, una hazaña desafiante para un jugador de computadora. A la luz de esto, Meta hizo la pregunta: “¿Podemos construir agentes más efectivos y flexibles que puedan usar el lenguaje para negociar, persuadir y trabajar con personas para lograr objetivos estratégicos de manera similar a como lo hacen los humanos?”

Recomendado:  Apple estaría trabajando en un MacBook Pro plegable para 2025

La respuesta, según Meta, es sí. Meta Cicero AI desarrolló sus habilidades jugando un juego de diplomacia en línea en webdiplomacy.net. Logró “más del doble del puntaje promedio” de los jugadores humanos a lo largo del tiempo y finalmente se ubicó en el 10% superior de los jugadores en múltiples juegos, lo que demuestra que había dominado el juego.

Meta AI Cicero se desarrolló utilizando métodos de razonamiento estratégico (similar a AlphaGo) y procesamiento de lenguaje natural (similar a GPT-3). Cicero hace predicciones sobre el comportamiento de otros jugadores durante cada juego al observar la condición del tablero de juego y la historia del diálogo. Crea una estrategia que pone en acción utilizando un modelo de lenguaje que puede producir un diálogo que suene humano, lo que le permite trabajar con otros participantes.

El núcleo de la personalidad de Cicero se puede encontrar en sus habilidades de lenguaje natural, a las que Meta se refiere como un “modelo de diálogo controlable”. Cicero utiliza un vasto corpus de texto extraído de la web, similar a GPT-3.

“Para construir un modelo de diálogo controlable, comenzamos con un modelo de lenguaje similar a BART de 2700 millones de parámetros entrenado previamente en texto de Internet y ajustado en más de 40 000 juegos humanos en webDiplomacy.net”. fijado Meta.

El modelo final captó los matices de un juego desafiante. Según Meta, Cicerón “puede deducir, por ejemplo, que más adelante en el juego necesitará el apoyo de un jugador en particular”, dice Meta, “y luego diseñar una estrategia para ganar el favor de esa persona, e incluso reconocer los riesgos y oportunidades”. que ese jugador ve desde su particular punto de vista”.

Recomendado:  Las 10 mejores aplicaciones de iOS que enseñan a los niños a programar

Bajo el título “Juego a nivel humano en el juego de la diplomacia mediante la combinación de modelos de lenguaje con razonamiento estratégico”, el estudio de Meta Cicero AI se publicó en la revista. Ciencia.

En términos de aplicaciones más amplias, Meta afirma que su estudio Cicero podría “aliviar las barreras de comunicación” entre las personas y la IA, por ejemplo, manteniendo una discusión prolongada para enseñarle a alguien una nueva habilidad. O podría ser la fuerza impulsora detrás de un videojuego donde los NPC pueden conversar como personas, captando las intenciones del jugador y cambiando a medida que avanzan.

Al mismo tiempo, esta tecnología podría usarse para manipular a los humanos haciéndose pasar por personas y engañándolas de maneras potencialmente peligrosas, según el contexto. En ese sentido, Meta espera que otros investigadores puedan desarrollar su código “de manera responsable” y dice que ha tomado medidas para detectar y eliminar “mensajes tóxicos en este nuevo dominio”, lo que probablemente se refiera al diálogo que Meta Cicero AI aprendió de Internet. textos que ingirió—siempre un riesgo para modelos de lenguaje grandes.

La empresa proporcionó un sitio detallado para explicar cómo funciona Meta Cicero AI y también tiene código abierto de Cicero en GitHub. En línea Diplomacia los fanáticos, y tal vez incluso el resto de nosotros, deben tener cuidado.

Sin embargo, dependiendo de la situación, esta tecnología podría emplearse para engañar a las personas y manipularlas mediante la suplantación de identidad. Probablemente refiriéndose al diálogo que Cicero recogió de los textos de Internet que ingirió, siempre un riesgo para los grandes modelos de lenguaje, Meta dice que ha tomado medidas para detectar y eliminar “mensajes tóxicos en este nuevo dominio” y que espera que otros investigadores se basen en ellos. su código “de manera responsable”.

Recomendado:  Puede descargar la aplicación Microsoft Teams de Microsoft Store pronto

Además de publicar el código fuente de Meta Cicero AI en GitHubla empresa mantiene una sitio web completo explicando cómo funciona. Los fanáticos de la diplomacia en línea deberían estar atentos, al igual que el resto de nosotros.

¿Cómo jugar webDiplomacy?

Ser el primer país en controlar la mitad de los centros de suministro en el juego es el objetivo de la diplomacia. Puedes hacer esto moviendo tus fuerzas por el tablero y combatiendo con otros jugadores para tomar el control de sus centros de suministro. Al final del año, por cada centro de suministro que controlas, puedes construir una nueva unidad que puedes usar para controlar más centros de suministro y hacer avanzar tu causa hacia la victoria. Debes disolver una unidad en lugar de perder un centro de suministro a favor de otro jugador, dejándote con menos unidades para competir por más centros de suministro.

Tabla de Contenido