Los italianos también ahora podemos comparar las respuestas que nos dieron desde los chatbots principales con la circulación actualmente en circulación: Indigo.ai De hecho, acaba de poner a disposición de todos Chatbot Arena Italiala primera plataforma de comparación de LLM (acrónimo para un modelo de lenguaje grande, o esos sistemas de inteligencia artificial que parecen entender lo que preguntamos por qué aparentemente nos responden como seres sensibles) para el idioma italiano.
Tal vez recuerde cuando el año pasado informamos el adelantamiento de Claude 3 contra GPT en pruebas ciegas. Para este tipo de comparaciones (como fue en esa ocasión) la mayor parte del tiempo se usa ChatBot Arena, una plataforma nacida en 2023 (hoy en día el punto de referencia mundial para la prueba y la comparación de la LLM) y que permite comparar precisamente las respuestas Dado por los chatbots más populares cuando se les hacen la misma pregunta.
Aquí, estas comparaciones ahora pueden hacerlas también e En nuestro idioma Usando Chatbot Arena Italia. La idea básica es usar esta nueva plataforma para elaborar una clasificación del mejor LLM específicamente para el idioma italiano: para cada resultado obtenido, de hecho, es posible dar un voto y así determinar cuál de los dos chatbots dio la respuesta mejoraro indique cuándo se enfrenta a un caso de atar o cuando ambos modelos comparados dieron una respuesta equivocado.
Cómo funciona Chatbot Arena Italia
Además de examinar el clasificación (Tabla de clasificación) Actualizado en tiempo real, cualquiera puede acceder a la nueva plataforma y probar varios modelos de chatbots escribiendo indicaciones en italiano.
La versión actual ofrece tres modos de iteración.
Con Arena (batallas) Es posible comparar dos LLM de forma anónima. Escribe la pregunta, aplastas el envío y luego comparas las respuestas sin saber de qué chatbots provienen. Es quizás el modo más democrático de todos en que en la mayoría de los casos es difícil entender qué IA se genera la respuesta y, en consecuencia, el voto del usuario no puede ser influenciado por sus prejuicios hacia un LLM en particular.
Alternativamente, puede seleccionar el panel Arena (lado a lado) Y cuestione dos IA con el mismo mensaje seleccionándolos manualmente. Cuando escribimos, puede elegir entre:
- Claude-3.5-Sonnet
- Claude-3.5-Haiku
- Claude-3-Haiku
- Claude-3-Sonnet
- Claude-3-opus
- Géminis-1.5 flash
- Géminis-1.5-Prip
- Gemini-2.0-flash
- Gemini-2.0-pro
- GPT-4O
- GPT-4O-Mini
- O1
- O1-Mini
- O3-Mini
- GPT-4-TURBO
- GPT-3.5-TURBO
- Gemma2-9b
- Mixtral-8x22b-insiRCUT-V0.1
- Mixtral-8x7b
- Deepseek-v3
- Llama-3.1-8b
- Llama-3.2-3b
- Lllamantino3
- Minerva-7b-insstructa
- Mistral-chat-v0.4
- Modelo-italy-9b
- Llama-3.3-70b
- QWEN2.5-72B-INSTRUCT-TURBO
- Deepseek-r1
- Mistral pequeño 3
- Phi 4
- Velvet-14b
Como la última opción es el Chat directo Lo que simplemente le permite seleccionar uno de los chatbots mencionados anteriormente y comenzar una conversación y hacer sus evaluaciones.
Cómo acceder a Chatbot Arena Italia
Si quieres intentarlo, es suficiente para ti haga clic aquí Para acceder a la plataforma Chatbot Arena Italia.
Como ya hemos dicho, es completamente gratis También es interesante por el hecho de que le permite probar versiones que normalmente se pagan, como ChatGPT O1 (que requiere una suscripción mensual de 20 $), así como acceder fácilmente a los chatbots italianos minerva y al modelo Italia, así como a los profundos chinos que El garante de privacidad había bloqueado en nuestro país a partir del 30 de enero.
Sobre inteligencia artificial
Encontrará muchas otras noticias relacionadas con el mundo de la inteligencia artificial recopilada en esta sección de nuestro sitio. Para obtener información sobre las aplicaciones e implicaciones de la IA, puede consultar esta área de MacityNet.