Hay un nuevo editor de imágenes de Apple, si sabes dónde buscar. Los reyes del iPhone se asociaron con investigadores de la Universidad de California en Santa Barbara para crear una herramienta que le permite editar fotos e imágenes con instrucciones basadas en texto. No tiene un lanzamiento oficial , pero los investigadores están organizando una demostración que puedes probar tú mismo, descubierta por primera vez por Tecnología extrema.
El proyecto se llama Edición de imágenes guiada por modelo de lenguaje grande multimodal (MGIE). Hay muchos editores de imágenes con IA en el mercado. ahora. Photoshop ahora viene con herramientas de IA integradas, y otras como DALL-E de OpenAI, le permiten editar imágenes,además de generar si nunca has intentado usarlas, sabes que puede ser un poco frustrante. En muchos casos, a la IA le resulta difícil comprender exactamente lo que estás buscando.
La innovación con MGIE es agregar otra capa de interpretación de IA. Cuando le dices a la IA lo que quieres ver, MGIE primero usa una IA basada en texto para hacer que sus instrucciones sean más explícitas y descriptivas. “Los resultados experimentales demuestran que las instrucciones expresivas son cruciales para las imágenes basadas en instrucciones edición”, dijeron los investigadores en un papel publicado en arXiv. “Nuestro MGIE puede conducir a una mejora notable».
Apple publicó una versión de código abierto del software en GitHub. Si tiene conocimientos, puede obtener una versión de MGIE ejecutándose por su cuenta, pero los investigadores configuraron la herramienta en Abrazando la cara. Funciona un poco lento cuando hay mucha gente usándolo, pero es un experimento divertido.
Gigantescas compañías tecnológicas como Apple gastan miles de millones de dólares en proyectos que nadie llega a ver, por lo que es completamente posible que esta llamada La herramienta MGIE nunca obtendrá un lanzamiento oficial. Apple no respondió de inmediato a una solicitud de comentarios.
Nosotros mismos lo probamos aquí en la oficina de Gizmodo. Subí una foto de mi colega y asesor más cercano Kyle Barr usando un extraño par de gafas de sol que compró en un Netflix en Show de electrónica de consumo de este año.Le dije a la IA “el hombre está parado en el desierto”. Antes de generar la imagen, la herramienta MGIE extrapoló:
“El hombre lleva un casco de metal y está parado en un entorno desértico. El entorno a su alrededor es árido y árido, con dunas de arena. extendiéndose hasta donde alcanza la vista”.
Después de jugar con la herramienta durante mucho más tiempo del que deberíamos, está claramente sujeta a muchas de las mismas limitaciones que cualquier otro generador de imágenes IA. Muchas veces, los resultados son extraños y nada como lo que pediste . Pero en algunos En algunos casos, hizo un trabajo impresionante y, en defensa del programa, la IA funciona mejor con sujetos familiares. “Familiar” no es algo llamarías a las gafas de sol de Kyle.
Este contenido ha sido traducido automáticamente del material original. Debido a los matices de la traducción automática, pueden existir ligeras diferencias. Para la versión original, haga clic aquí.