Google DeepMind lanzó su nuevo modelo de generación y edición de imágenes, construido sobre Gemini 3 Pro. Reemplaza a Nano Banana (Gemini 2.5 Flash Image) con capacidades superiores de razonamiento visual, conocimiento del mundo real integrado, imágenes en 4K y texto legible.
Puntos Clave
• Crea texto legible perfectamente en imágenes.
• Crea imágenes con cualquier aspect ratio
• Procesa hasta 14 imágenes de entrada
• Puede crear varias imágenes secuenciales desde un solo prompt
• Maneja distintos ángulos de cámara y tipos de toma
• Ya disponible en Gemini y Google AI Studio.
Por qué es importante
Lo disruptivo no es solo la edición y calidad visual, sino la capacidad de renderizar texto extenso y legible dentro de la imagen. Esto permite convertir datos complejos o estudios en infografías listas para usar. Al eliminar el problema de letras borrosas e incoherentes, deja de ser un juguete generador de “arte decorativo” y se vuelve un motor funcional para crear material educativo y de negocios.
Meta lanzó dos modelos de IA open source que merecen les pongas atención. SAM 3 identifica y segmenta objetos en imágenes con mayor precisión, y SAM 3D genera reconstrucciones tridimensionales a partir de múltiples vistas en menos de un segundo.
Puntos Clave
• Detecta objetos difusos o poco claros
• Acepta prompts de texto detallados (ej: "gorra de béisbol roja")
• Puede combinarse con modelos de lenguaje para entender prompts complejos
• Llegará a Edits, Instagram, Ads, Market Place próximamente
• SAM 3D reconstruye geometría tridimensional completa
• Disponible en "Segment Anything Playground" para experimentar sin conocimientos técnicos
Por qué es importante
Esto es más grande de lo que parece.. Con esto tomarás una foto de un mueble y verlo en 3D en tu sala en segundos. O subir un video de tu producto y recortar objetos con solo decir “la botella roja”. Meta ya lo está integrndo en Marketplace para visualizar muebles antes de comprar. Arquitectos pueden pasar de bocetos a modelos 3D y clínicas segmentar órganos con una simple descripción. Y además es open source.
OpenAI presentó una nueva funcionalidad que permite a los usuarios invitar a otras personas a participar dentro de una misma conversación mediante un enlace compartido para colaborar en tiempo real.
Puntos Clave
• La IA interviene cuando es citada
• Contexto unificado para todos los miembros
• Privacidad independiente de chats personales
• Creas perfil de usuario con foto para que todos sepan quien eres
• Puedes agregar de 1 a 20 personas por chat
• Acceso exclusivo para planes de pago
Por qué es importante
Una utilidad de esto en equipos de trabajo es traer al equipo al mismo hilo, el modelo actúa como un árbitro neutral que mantiene la coherencia de los datos mientras todos iteran sobre la misma idea. También, sirve como entrenamiento pasivo, ya que los miembros con menos experiencia aprenden mejores estrategias de prompting simplemente observando cómo sus compañeros corrigen y guían a la IA.
Google amplió las capacidades de NotebookLM añadiendo Deep Research y más fuentes como Google sheets, documentos de Word y hasta PDFs. Hace dos semanas ya había anunciado la integración de ventana de contexto y memoria expandida, y nuevas opciones de personalización para las conversaciones. Y ahora con Nano Banana Pro, añade la función de infografías.
Puntos Clave
• Mejora de 50% en satisfacción de usuarios con respuestas
• Ventana de contexto expandida a 1 millón de tokens
• Historial de conversación guardado y seguro automáticamente
• Personalización de chat con objetivos y roles específicos
• Soporte para Google Sheets con análisis de datos estructurados
• Deep Research genera informes detallados automáticamente navegando cientos de sitios
• Agente crea plan de investigación y refina búsqueda mientras aprende
Por qué es importante
NotebookLM ha sido el experimento más exitoso de Google en mucho tiempo. Terminó siendo una de las apps de IA más prácticas y funcionales que existen y no aflojan el paso.. está iterando NotebookLM cada dos semanas con mejoras sustanciales. Deep Research te ahorra el trabajo manual de investigación en internet. El millón de tokens te deja analizar libros completos. La personalización del chat lo adapta a tu forma de trabajar.. todo esto combinado con los audio y video overviews la hacen una herramientas demasiado poderosa para aprender y estudiar cualquier tema.