Anthropic presenta Claude 3.5 Sonnet, marcando nuevas referencias en IA

Gábor Bíró • 21 de junio de 2024

3 min de lectura

El nuevo modelo de inteligencia artificial de Anthropic, Claude 3.5 Sonnet, establece nuevos estándares en la industria en cuanto a razonamiento, conocimiento y capacidades de programación. Operando al doble de velocidad que su predecesor, el modelo sobresale en tareas complejas y mejora la colaboración con la nueva función Artifacts.

Anthropic presenta Claude 3.5 Sonnet, marcando nuevas referencias en IA

Anthropic ha presentado su modelo de inteligencia artificial más reciente y avanzado, Claude 3.5 Sonnet, que muestra mejoras significativas en rendimiento y capacidades en comparación con modelos anteriores. Los avances clave del nuevo modelo incluyen:

Superar a modelos competidores como GPT-4o de OpenAI, Gemini 1.5 Pro de Google y Llama 3 400B de Meta en 7 de 9 benchmarks generales y 4 de 5 benchmarks de visión.
Establecer nuevas referencias en la industria para el razonamiento a nivel de posgrado (GPQA), el conocimiento a nivel de pregrado (MMLU) y el dominio de la programación (HumanEval).
Operar al doble de velocidad que el anterior modelo superior de Anthropic, Claude 3 Opus.
Sobresalir en la escritura y traducción de código, la gestión de flujos de trabajo de varios pasos y la interpretación de gráficos y diagramas.
Demostrar una mejor comprensión de los matices, el humor y las instrucciones complejas.
Generar contenido de alta calidad con un tono natural y cercano.
Resolver el 64% de los problemas en pruebas internas de codificación agentiva, en comparación con el 38% de Claude 3 Opus.
Superar a Claude 3 Opus en benchmarks de visión estándar, mostrando una mejor capacidad de razonamiento visual y transcripción de texto a partir de imágenes imperfectas.

Estas mejoras hacen de Claude 3.5 Sonnet una herramienta poderosa para tareas complejas como la atención al cliente sensible al contexto y la orquestación de flujos de trabajo de varios pasos.

Junto con el nuevo modelo, Anthropic presentó la función Artifacts, diseñada para mejorar la colaboración y la productividad. Esta innovadora función permite a los usuarios ver, editar y construir sobre contenido generado por IA —como fragmentos de código y documentos de texto— en tiempo real dentro de la interfaz de chat. Artifacts transforma a Claude en un espacio de trabajo colaborativo dinámico, permitiendo a los equipos integrar sin problemas el contenido generado por IA en sus proyectos y flujos de trabajo. Por ejemplo, los equipos de diseño y UX pueden utilizar Artifacts para crear, iterar y refinar prototipos de UI de forma colaborativa, aprovechando la comprensión de Claude de los principios de diseño y su capacidad para generar elementos visuales.

Anthropic enfatiza su compromiso con la seguridad y la privacidad con Claude 3.5 Sonnet. El modelo se sometió a pruebas rigurosas y fue entrenado para reducir el uso indebido, involucrando a expertos externos como el Instituto de Seguridad de la Inteligencia Artificial del Reino Unido (UK AISI). Anthropic también incorporó comentarios de expertos en seguridad infantil para actualizar clasificadores y ajustar modelos. La empresa reafirma su postura sobre la privacidad de los datos, afirmando que los datos enviados por los usuarios no se utilizan para entrenar sus modelos generativos sin permiso explícito. Estas medidas reflejan los esfuerzos de Anthropic para abordar los riesgos potenciales y mantener la confianza de los usuarios en su tecnología de IA.

El nuevo modelo de IA está disponible de forma gratuita en Claude.ai y en la aplicación Claude para iOS, con límites de velocidad más altos para los suscriptores de Claude Pro y Team. Los usuarios también pueden acceder a Claude 3.5 Sonnet a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Anthropic planea completar la familia de modelos Claude 3.5 a finales de este año con el lanzamiento de Claude 3.5 Haiku y Claude 3.5 Opus. La empresa también está desarrollando nuevas funciones e integraciones, incluyendo una función de Memoria que permitirá a Claude recordar las preferencias del usuario y el historial de interacciones.

Recomendados

Tesla Optimus

8 de julio de 2024 • 5 min de lectura

Elon Musk y Tesla han entrado una vez más en un nuevo campo, esta vez el mundo de los robots humanoides. El proyecto Tesla Optimus tiene como objetivo revolucionar la robótica y crear robots capaces de realizar numerosas tareas en la industria y más allá. Aunque las opiniones sobre el proyecto son diversas, una cosa es segura: los robots Optimus ya han capturado la atención mundial y encierran un potencial significativo.

La IA no puede ser titular de patentes

13 de febrero de 2024 • 3 min de lectura

La inteligencia artificial (IA) no puede ser legalmente reconocida como "inventor" en solicitudes de patente en Estados Unidos, una postura confirmada por el Tribunal de Apelaciones del Circuito Federal de EE. UU. y reforzada por directrices de la Oficina de Patentes y Marcas de EE. UU. (USPTO). Esta posición afirma que, según la ley estadounidense actual, solo los seres humanos califican para la condición de inventor.

Robots que aprenden trabajando: El auge de la IA de autoaprendizaje

12 de agosto de 2024 • 5 min de lectura

Imagina robots que no solo siguen instrucciones preprogramadas, sino que realmente aprenden y se adaptan mientras realizan tareas en nuestro mundo impredecible. Investigadores del MIT han desarrollado recientemente un nuevo algoritmo llamado "Estimar, Extrapolar y Situar" (EES), marcando un paso significativo en esta dirección. Esta innovación promete mejorar la robótica al permitir que las máquinas se entrenen a sí mismas de manera efectiva, reduciendo la necesidad de intervención humana constante y revolucionando potencialmente sus capacidades en numerosos campos.

¿Obtenemos mejores respuestas al consultar modelos en inglés?

30 de diciembre de 2024 • 7 min de lectura

Al usar Modelos de Lenguaje Extensos (LLM) como GPT-4o o Claude Sonnet, surge una pregunta común, especialmente para la gran cantidad de usuarios en todo el mundo que interactúan con estas herramientas en idiomas distintos al inglés: ¿qué idioma se debe usar para lograr los resultados más efectivos? Si bien las capacidades multilingües de estos modelos permiten una comunicación efectiva en numerosos idiomas, su rendimiento a menudo parece disminuir en comparación con las interacciones realizadas puramente en inglés. Esta exploración profundiza en por qué podría ser este el caso y cuándo cambiar al inglés podría ser beneficioso.

La trampa de la eficiencia

5 de marzo de 2025 • 4 min de lectura

¿Alguna vez te has preguntado por qué la tecnología moderna, que supuestamente facilita nuestra vida y nos ahorra tiempo, en realidad no se traduce en más tiempo libre? ¿Por qué trabajamos tanto o quizás incluso más que nuestros abuelos, a pesar de estar rodeados de lavadoras, lavavajillas, ordenadores y smartphones? La respuesta reside en un fenómeno ya reconocido durante la Revolución Industrial, conocido como la Paradoja de Jevons.

Computación Cognitiva

17 de septiembre de 2024 • 3 min de lectura

El mundo de la tecnología introduce constantemente nuevos y emocionantes desarrollos que cambian nuestras vidas y la forma en que trabajamos. Entre los más prometedores e intrigantes se encuentra la computación cognitiva. Pero, ¿qué es exactamente y por qué es tan importante?

La Singularidad de la IA

23 de abril de 2025 • 8 min de lectura

El término "Singularidad" ha trascendido el discurso científico de nicho para convertirse en un motivo recurrente en la cultura popular, apareciendo de forma destacada en películas, artículos de noticias y debates públicos. A menudo representado con dramatismo, evoca imágenes de inteligencia artificial descontrolada y una existencia humana fundamentalmente alterada. Aunque a veces se sensacionaliza, el concepto subyacente merece una seria consideración, especialmente a medida que los avances en Inteligencia Artificial (IA) se aceleran.