Apple releases open-source, AI-powered image editing model MGIE with natural language instructions, collaborating with UC researchers. Apple lanza el modelo MGIE de edición de imágenes de código abierto impulsado por IA con instrucciones en lenguaje natural, en colaboración con investigadores de la UC.
Apple has launched a new AI image editing model, MGIE, in collaboration with researchers from the University of California. Apple ha lanzado un nuevo modelo de edición de imágenes con IA, MGIE, en colaboración con investigadores de la Universidad de California. MGIE, which stands for MLLM-Guided Image Editing, uses multimodal large language models (MLLMs) and allows users to edit images based on natural language instructions. MGIE, que significa edición de imágenes guiada por MLLM, utiliza modelos de lenguaje grande multimodal (MLLM) y permite a los usuarios editar imágenes basándose en instrucciones en lenguaje natural. The model was presented in a paper at the International Conference on Learning Representations 2024, showcasing its ability to improve automatic metrics and human evaluation while maintaining competitive inference efficiency. El modelo se presentó en un artículo en la Conferencia Internacional sobre Representaciones del Aprendizaje 2024, mostrando su capacidad para mejorar las métricas automáticas y la evaluación humana mientras se mantiene la eficiencia de la inferencia competitiva.