GLIDE by OpenAI

Text-to-image - Генерація фотореалістичних зображень

Про GLIDE by OpenAI

Компанія OpenAI недавно запустила GLIDE (Guided Language-to-Image Diffusion for Generation and Editing) - модель на основі штучного інтелекту, яка дозволяє користувачам генерувати фотореалістичні зображення за допомогою текстових запитів. Ця модель має порівнянну продуктивність з DALL-E, але використовує лише 3,5 мільярда параметрів, тоді як DALL-E використовує 12 мільярдів.

За допомогою GLIDE користувачі можуть легко і швидко створювати візуальні елементи за допомогою текстових введень, що спрощує вдосконалення та редагування зображень. Вона також може використовуватися для зміни існуючих зображень за допомогою команд на природній мові, таких як додавання об'єктів, тіней, відбитків та виконання заповнення зображень. Крім того, вона має здатність перетворювати прості лінійні малюнки в реалістичні фотографії і навіть виконувати завдання виробництва та відновлення для складних обставин.

Люди віддають перевагу зображенням, згенерованим GLIDE, порівняно з DALL-E, навіть якщо перша використовує менше параметрів. Крім того, вона має коротшу затримку при генерації та не потребує переупорядкування CLIP.

Джерело: https://www.marktechpost.com/2021/12/29/openai-introduces-glide-model-for-photorealistic-image-generation/