Gemini 2.5 Pro I/O: Explicación detallada de las funciones

Gemini 2.5 Pro I/O Edition representa una actualización clave del modelo insignia de IA de Google DeepMind, que ofrece una destreza de codificación inigualable, capacidades de entrada/salida ampliadas y flujos de trabajo optimizados para desarrolladores. Lanzada con antelación a Google I/O 2025, esta versión preliminar eleva el desarrollo frontend e UI al asegurar el primer puesto en la clasificación de WebDev Arena, lograr una comprensión de video de vanguardia e introducir mejoras robustas en la llamada a funciones y la reducción de errores. Con el mismo precio que su predecesor (1.25 $ por millón de tokens de entrada y 10 $ por millón de tokens de salida), ofrece una solución rentable frente a la competencia, manteniendo una generosa ventana de contexto de 200,000 XNUMX tokens. Las funciones de E/S multimodal, como la conversión de vídeo a código y la generación de aplicaciones con un solo mensaje, simplifican la creación de prototipos, y las recomendaciones de los líderes del sector subrayan su valor práctico. De cara al futuro, Google planea ampliar las capacidades de contexto e integrar funciones de E/S avanzadas, consolidando la posición de Gemini como una herramienta indispensable para los desafíos de codificación del mundo real.

¿Qué es Gemini 2.5 Pro I/O Edition?

Génesis y cronología de lanzamiento

Gemini 2.5 Pro I/O Edition se anunció el 6 de mayo de 2025 como una versión preliminar diseñada para que los desarrolladores tuvieran una ventaja antes de la conferencia para desarrolladores Google I/O a finales de ese mes. Esta edición reemplaza la versión del 25 de marzo (03/25) con un modelo actualizado denominado "05/06", que redirige automáticamente a los usuarios de Gemini 2.5 Pro a la nueva versión sin necesidad de realizar ninguna acción.

¿Qué distingue a la Edición I/O?

A diferencia de las actualizaciones estándar centradas en optimizaciones de backend, la Edición I/O enfatiza notablemente las capacidades de codificación, tanto en el frontend como en las transformaciones de código fundamentales. Introduce funciones de E/S multimodales refinadas, como la comprensión de video y la generación de aplicaciones interactivas, que amplían la utilidad del modelo más allá del texto y el código, a dominios multimedia más completos.

¿Cuáles son las mejoras principales en Gemini 2.5 Pro?

¿Cómo se ha mejorado el rendimiento de la codificación?

Gemini 2.5 Pro ahora ofrece capacidades de generación y refactorización de código significativamente mejoradas, gestionando tareas complejas de reestructuración de back-end con abstracción y decisiones arquitectónicas de nivel de desarrollador sénior. En las pruebas de rendimiento internas de Cognition, superó por primera vez los casos de prueba avanzados para desarrolladores, mostrando un robusto rediseño de módulos, reescritura de API e implementación de lógica de varios pasos sin necesidad de ajustes adicionales.

Además, se ha mejorado la fiabilidad de las llamadas a funciones: las tasas de error se han reducido considerablemente, mientras que las tasas de activación han aumentado, lo que permite una construcción más fluida de flujos de trabajo de agente que encadenan múltiples llamadas a funciones. Los desarrolladores que ya utilizan la API de Gemini disfrutarán de una transición fluida, ya que el sistema adopta automáticamente el modelo actualizado sin necesidad de realizar cambios en el código.

¿Qué capacidades de interfaz de usuario y front-end se han agregado?

En el ámbito del desarrollo front-end, Gemini 2.5 Pro asciende a la posición n.° 1 en la tabla de clasificación de WebDev Arena (una clasificación de modelos de IA de preferencia humana para crear aplicaciones web funcionales y estéticamente agradables), superando a Claude 3.7 Sonnet y versiones anteriores de Gemini por más de 140 puntos ELO.

El modelo puede convertir automáticamente maquetas de diseño en componentes HTML, CSS y JavaScript listos para producción, con diseños adaptables y un estilo consistente. Reconoce elementos visuales como interacciones de botones, tipografía, espaciado y animaciones, y los reproduce fielmente para garantizar que los nuevos módulos de interfaz de usuario se integren a la perfección con los sistemas de diseño existentes. Por ejemplo, los desarrolladores que usan la aplicación de inicio Gemini 95 pueden solicitar un reproductor de video con estilo propio y el modelo inferirá los tokens de diseño del proyecto y generará un componente listo para usar en segundos.

¿Cómo fusiona Gemini 2.5 Pro la comprensión de video con la generación de código?

Gemini 2.5 Pro extiende sus capacidades multimodales nativas al vídeo: obtuvo una puntuación del 84.8 % en el nuevo benchmark VideoMME, situándose entre los mejores modelos grandes de "comprensión de vídeo" disponibles. Aprovechando esta ventaja, los desarrolladores pueden proporcionar un clip de YouTube y recibir una aplicación de aprendizaje o demostración totalmente interactiva, con contenido extraído, pantallas de interfaz de usuario personalizadas y scripts lógicos subyacentes.

La demostración "Video to Learning App" de Google AI Studio ilustra este flujo de trabajo: se introduce un videotutorial, se asignan los puntos clave a módulos interactivos y se genera una aplicación educativa completa sin intervención humana. Este avance marca una transición del "código basado en lenguaje" a la creación de "productos basados en video" en el panorama multimodal de la IA.

¿Dónde y cómo pueden los desarrolladores acceder a Gemini 2.5 Pro?

¿Qué plataformas y modelos de precios se aplican?

La edición Gemini 2.5 Pro I/O ya está disponible a través de la API de Gemini en Google AI Studio y de Vertex AI para clientes empresariales. La versión preliminar mantiene el mismo precio que la anterior, lo que garantiza que no haya costes adicionales para los primeros usuarios.

De forma predeterminada, todas las llamadas a la API existentes dirigidas al punto de conexión de Gemini 2.5 se redirigen automáticamente al nuevo modelo Pro (05-06), lo que elimina la sobrecarga de migración para los equipos de desarrollo. Para mayor transparencia, se han publicado tarjetas de modelo detalladas que documentan los resultados de las pruebas de rendimiento y los cambios de funciones junto con la versión.

CometAPI ya admite la llamada a la API de E/S de Gemini 2.5 Pro (nombre del modelo: ggemini-2.5-pro-preview-05-06).

¿Cómo se compara Gemini 2.5 Pro con sus competidores?

Géminis 2.5 Pro

¿Qué tan dominante es su ranking en WebDev Arena?

Con una puntuación de Arena de 1419.95, Gemini 2.5 Pro lidera el ranking de WebDev Arena, superando con creces a Claude 3.7 Sonnet (1357.10) y GPT‑4.1 (1261.35). Este avance refleja la preferencia de los usuarios por la combinación de fidelidad de diseño, facilidad de mantenimiento del código y una interfaz de usuario impecable de Gemini.

¿Qué revelan los parámetros de referencia de IA más amplios?

Más allá del front-end, Gemini 2.5 Pro amplía su ventaja en pruebas de razonamiento general y programación. En LMArena (una combinación de pruebas de comprensión de IA y resolución de problemas), supera en 39 puntos ELO a su competidor más cercano, según Demis Hassabis, CEO de Google DeepMind.

Su destreza multimodal, que abarca texto, audio, imágenes, video y código, continúa diferenciándolo en un mercado donde el razonamiento de IA integrado se está convirtiendo rápidamente en algo fundamental.

¿Qué casos de uso del mundo real resaltan sus capacidades?

Prototipado de aplicaciones a partir de un único mensaje

Una de las características más destacadas de la Edición I/O es su capacidad para generar aplicaciones web interactivas completas a partir de una sola solicitud. Dentro de la aplicación Gemini, los usuarios pueden introducir temas de diseño o patrones visuales y recibir código completo para aplicaciones funcionales, lo que reduce drásticamente los ciclos de creación de prototipos.

Flujos de trabajo y integración de Agentic

El modelo mejorado impulsa flujos de trabajo de agentes sofisticados, como lo demuestran las integraciones con Replit Agent y el agente de código de Cursor. Estas canalizaciones automatizan tareas complejas, como la refactorización del enrutamiento del backend y el diseño de componentes de la interfaz de usuario, con mínima intervención humana.

¿Qué comentarios han proporcionado los desarrolladores?

Respaldos de líderes de la industria

Silas Alberti, de Cognition, elogió la madurez del modelo, destacando su capacidad para realizar refactorizaciones a gran escala con la calidad necesaria para la toma de decisiones de alto nivel. Michele Catasta, de Replit, destacó la superioridad en el equilibrio entre capacidad y latencia, destacando su idoneidad para tareas sensibles a la latencia. Paul Couvert, educador de IA y fundador de BlueShell, y Pietro Schirano, director ejecutivo de EverArt, destacaron sus fortalezas en la generación de código e interfaz de usuario mediante recomendaciones en redes sociales.

Integración en plataformas como Replit y Cursor

Las pruebas internas de Cursor muestran menos fallos en las llamadas a herramientas y una mayor fiabilidad, lo que ha impulsado a la empresa a integrar la Edición de E/S en su agente de código principal. Asimismo, Replit está explorando una integración más profunda para la asistencia a la codificación en tiempo real, aprovechando las llamadas a funciones mejoradas del modelo y la E/S multimodal.

Empieza

CometAPI proporciona acceso a más de 500 modelos de IA, incluyendo modelos multimodales de código abierto y especializados para chat, imágenes, código y más. Su principal ventaja radica en simplificar el proceso, tradicionalmente complejo, de integración de IA. Con CometAPI, se puede acceder a herramientas de IA líderes como Claude, OpenAI, Deepseek y Gemini mediante una única suscripción unificada. Puedes usar la API de CometAPI para crear música y material gráfico, generar vídeos y crear tus propios flujos de trabajo.

CometAPI Ofrecemos un precio mucho más bajo que el precio oficial para ayudarte a integrarte API de Gemini 2.5 Pro¡Recibirás $1 en tu cuenta después de registrarte e iniciar sesión! Bienvenido a registrarte y a experimentar CometAPI. CometAPI paga por uso.API de Gemini 2.5 Pro (nombre del modelo: gemini-2.5-pro-preview-05-06) en CometAPI Los precios se estructuran de la siguiente manera:

Tokens de entrada: $1/M tokens
Tokens de salida: $8 / M tokens

Para una integración rápida, consulte Documento API