Tu Piildora diariaResumen rápido de lo más importante en tecnología y ciencia |
|
INTELIGENCIA ARTIFICIALEl modelo más poderoso de Anthropic disponible al público cierra la brecha con su IA secreta
El 16 de abril de 2026, Anthropic lanzó Claude Opus 4.7, su modelo de lenguaje más capaz disponible para el público general. La nueva versión supera a su predecesor, Claude Opus 4.6, en tareas de programación agéntica —donde los sistemas de IA ejecutan flujos de trabajo complejos de forma autónoma sin intervención humana—, razonamiento multidisciplinario, uso de herramientas a escala y control de computadoras. Su precio se mantiene igual al del modelo anterior: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, con descuentos de hasta 90% mediante caché de prompts y 50% en procesamiento por lotes. Está disponible en los planes Pro, Max, Team y Enterprise de Claude, y en la API de Anthropic a través de proveedores en la nube: Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.
Una de sus mejoras más concretas es en visión computacional. En pruebas internas de la empresa de ciberseguridad XBOW, Opus 4.7 obtuvo un 98.5% en su benchmark de agudeza visual, frente al 54.5% de Claude Opus 4.6 —un salto que la propia empresa califica de transformador para sus flujos de trabajo. El modelo cuenta con una ventana de contexto de 1 millón de tokens, suficiente para procesar el equivalente a cientos de documentos extensos en una sola sesión, y puede generar hasta 300,000 tokens en una respuesta única a través de la API de lotes. Anthropic lanzó la familia Claude 4 en mayo de 2025 con Opus 4 alcanzando el 72.5% en SWE-bench, el referente del sector para evaluar si una IA puede resolver problemas reales de programación en repositorios de GitHub. Desde ese arranque, la compañía ha iterado con una velocidad inusual: cuatro versiones Opus en nueve meses. Aun así, el propio CEO Dario Amodei ha reconocido que Opus 4.7 sigue siendo menos capaz que Claude Mythos Preview, el modelo más avanzado de la empresa, que permanece fuera del alcance del público por razones de seguridad. |
|
El modelo de IA que Anthropic consideró demasiado peligroso para lanzar al públicoEl 7 de abril de 2026, Anthropic reveló que su modelo más avanzado —Claude Mythos Preview— no estaría disponible para el público general. La razón: su capacidad para descubrir y explotar vulnerabilidades de seguridad informática es tan elevada que la compañía determinó que podría facilitar ciberataques a escala masiva si cayera en manos equivocadas. En lugar de un lanzamiento abierto, Anthropic creó el Proyecto Glasswing, una iniciativa que otorga acceso restringido al modelo a socios seleccionados: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Fundación Linux, Microsoft, NVIDIA y Palo Alto Networks, además de más de 40 organizaciones adicionales responsables de infraestructura crítica de software.Los hallazgos documentados durante las pruebas internas son concretos e inquietantes. Mythos Preview identificó de forma autónoma —sin ningún humano involucrado después de la instrucción inicial— miles de vulnerabilidades de día cero, es decir, fallos desconocidos incluso para los propios desarrolladores del software afectado, en todos los sistemas operativos y navegadores web principales. Entre los casos confirmados: explotó una vulnerabilidad de 17 años en FreeBSD registrada como CVE-2026-4747, y descubrió un fallo de 27 años en OpenBSD, sistema operativo célebre precisamente por su historial de seguridad. El Instituto de Seguridad de IA del Reino Unido determinó de forma independiente que Mythos es el primer modelo en completar su simulación de ataque de toma de control de red completa. Para el Proyecto Glasswing, Anthropic comprometió 100 millones de dólares en créditos de uso del modelo y 4 millones de dólares adicionales en donaciones a organizaciones de seguridad de código abierto. |
|
La carrera de las IA en 2026: nadie lidera en todo y los modelos abiertos ya compiten de igual a igualAbril de 2026 registra el panorama más competitivo en la historia de los modelos de lenguaje de gran escala. Solo en el primer trimestre del año, la plataforma LLM Stats —que monitorea más de 500 modelos en tiempo real— contabilizó 255 lanzamientos de modelos por parte de organizaciones importantes. La frontera entre modelos de código abierto y propietarios se ha borrado prácticamente: GLM-5, de la empresa china Z.ai, alcanza un 77.8% en SWE-bench Verified —el referente para evaluar resolución autónoma de errores en código real—, y MiniMax M2.5 llega al 80.2%, igualando a los mejores modelos cerrados. DeepSeek V4, construido íntegramente con chips Huawei sin un solo procesador Nvidia, opera 1 billón de parámetros por apenas 0.28 dólares por millón de tokens de entrada: hace un año, una capacidad equivalente costaba cien veces más.Entre los líderes por categoría, ninguno es absoluto. Gemini 3.1 Pro de Google encabeza los benchmarks de razonamiento más exigentes: 94.3% en GPQA Diamond —que mide conocimiento científico de nivel graduado diseñado para resistir búsquedas web— y 77.1% en ARC-AGI-2, una prueba de inteligencia fluida. También lidera SWE-bench con 78.80%, igualado de cerca por GPT-5.4 de OpenAI (78.20%) y Claude Opus 4.6 de Anthropic. GPT-5.4, lanzado el 5 de marzo de 2026, opera en el ecosistema de ChatGPT, que recibe 5,800 millones de visitas mensuales. Grok 4 de xAI compite en programación con 75% en SWE-bench, respaldado por acceso en tiempo real a la red X. La conclusión que emerge de los benchmarks independientes es directa: para escritura y prosa extensa, Claude; para razonamiento científico, Gemini; para tareas generalistas con el mayor ecosistema de usuarios, GPT. Fuente: Anthropic Fuente: Anthropic / Fortune Fuente: Build Fast With AI / Vellum AI |
|
|
¿Tienes comentarios? Escríbenos a equipo@piild.com © 2026 Piild. Todos los derechos reservados. |
Anthropic y la guerra por la mejor IA
Claude Opus 4.7, el más poderoso al alcance de todos. El modelo de IA demasiado peligroso para el público. 2026: la guerra de las IAs y el colapso de costos.
El 16 de abril de 2026, Anthropic lanzó Claude Opus 4.7, su modelo de lenguaje más capaz disponible para el público general. La nueva versión supera a su predecesor, Claude Opus 4.6, en tareas de programación agéntica —donde los sistemas de IA ejecutan flujos de trabajo complejos de forma autónoma sin intervención humana—, razonamiento multidisciplinario, uso de herramientas a escala y control de computadoras. Su precio se mantiene igual al del modelo anterior: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida, con descuentos de hasta 90% mediante caché de prompts y 50% en procesamiento por lotes. Está disponible en los planes Pro, Max, Team y Enterprise de Claude, y en la API de Anthropic a través de proveedores en la nube: Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.