Anthropic presenta Claude 3.5 Sonnet, marcando nuevas referencias en IA

Gábor Bíró 21 de junio de 2024
3 min de lectura

El nuevo modelo de inteligencia artificial de Anthropic, Claude 3.5 Sonnet, establece nuevos estándares en la industria en cuanto a razonamiento, conocimiento y capacidades de programación. Operando al doble de velocidad que su predecesor, el modelo sobresale en tareas complejas y mejora la colaboración con la nueva función Artifacts.

Anthropic presenta Claude 3.5 Sonnet, marcando nuevas referencias en IA
Fuente: Anthropic

Anthropic ha presentado su modelo de inteligencia artificial más reciente y avanzado, Claude 3.5 Sonnet, que muestra mejoras significativas en rendimiento y capacidades en comparación con modelos anteriores. Los avances clave del nuevo modelo incluyen:

  • Superar a modelos competidores como GPT-4o de OpenAI, Gemini 1.5 Pro de Google y Llama 3 400B de Meta en 7 de 9 benchmarks generales y 4 de 5 benchmarks de visión.
  • Establecer nuevas referencias en la industria para el razonamiento a nivel de posgrado (GPQA), el conocimiento a nivel de pregrado (MMLU) y el dominio de la programación (HumanEval).
  • Operar al doble de velocidad que el anterior modelo superior de Anthropic, Claude 3 Opus.
  • Sobresalir en la escritura y traducción de código, la gestión de flujos de trabajo de varios pasos y la interpretación de gráficos y diagramas.
  • Demostrar una mejor comprensión de los matices, el humor y las instrucciones complejas.
  • Generar contenido de alta calidad con un tono natural y cercano.
  • Resolver el 64% de los problemas en pruebas internas de codificación agentiva, en comparación con el 38% de Claude 3 Opus.
  • Superar a Claude 3 Opus en benchmarks de visión estándar, mostrando una mejor capacidad de razonamiento visual y transcripción de texto a partir de imágenes imperfectas.

Estas mejoras hacen de Claude 3.5 Sonnet una herramienta poderosa para tareas complejas como la atención al cliente sensible al contexto y la orquestación de flujos de trabajo de varios pasos.

Junto con el nuevo modelo, Anthropic presentó la función Artifacts, diseñada para mejorar la colaboración y la productividad. Esta innovadora función permite a los usuarios ver, editar y construir sobre contenido generado por IA —como fragmentos de código y documentos de texto— en tiempo real dentro de la interfaz de chat. Artifacts transforma a Claude en un espacio de trabajo colaborativo dinámico, permitiendo a los equipos integrar sin problemas el contenido generado por IA en sus proyectos y flujos de trabajo. Por ejemplo, los equipos de diseño y UX pueden utilizar Artifacts para crear, iterar y refinar prototipos de UI de forma colaborativa, aprovechando la comprensión de Claude de los principios de diseño y su capacidad para generar elementos visuales.

Anthropic enfatiza su compromiso con la seguridad y la privacidad con Claude 3.5 Sonnet. El modelo se sometió a pruebas rigurosas y fue entrenado para reducir el uso indebido, involucrando a expertos externos como el Instituto de Seguridad de la Inteligencia Artificial del Reino Unido (UK AISI). Anthropic también incorporó comentarios de expertos en seguridad infantil para actualizar clasificadores y ajustar modelos. La empresa reafirma su postura sobre la privacidad de los datos, afirmando que los datos enviados por los usuarios no se utilizan para entrenar sus modelos generativos sin permiso explícito. Estas medidas reflejan los esfuerzos de Anthropic para abordar los riesgos potenciales y mantener la confianza de los usuarios en su tecnología de IA.

El nuevo modelo de IA está disponible de forma gratuita en Claude.ai y en la aplicación Claude para iOS, con límites de velocidad más altos para los suscriptores de Claude Pro y Team. Los usuarios también pueden acceder a Claude 3.5 Sonnet a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. Anthropic planea completar la familia de modelos Claude 3.5 a finales de este año con el lanzamiento de Claude 3.5 Haiku y Claude 3.5 Opus. La empresa también está desarrollando nuevas funciones e integraciones, incluyendo una función de Memoria que permitirá a Claude recordar las preferencias del usuario y el historial de interacciones.

Gábor Bíró 21 de junio de 2024