DALL-E (стилізований запис — DALL-E), а також DALL-E 2 — створені шляхом машинного навчання нейронні моделі, розроблені компанією OpenAI за фінансової підтримки Microsoft, призначені для створення цифрових зображень на основі описів природною мовою, званих «підказками». Компанія OpenAI представила нейронну мережу DALL-E у своєму блозі в січні 2021 року. DALL-E використовує мовну модель GPT-3, модифіковану для генерації зображень. У квітні 2022 року компанія OpenAI представила DALL-E 2 — наступну версію свого продукту, розроблену для створення реалістичніших зображень, які мають вищу роздільну здатність і «здатні поєднувати концепції, атрибути й стилі».
OpenAI не опублікувала початковий код своїх моделей, але зображення, згенеровані на основі обмеженого набору пробних запитів, можна отримати на її вебсайті. Незважаючи на це, в інтернеті з'явилося кілька емуляцій із відкритим кодом, створених на меншому обсязі даних.
Назва DALL-E — це контамінація імен ВОЛЛ-І (WALL-E), мультиплікаційного персонажа компанії Pixar, та іспанського художника-сюрреаліста Сальвадора Далі.
Історія
Компанія OpenAI почала розробляти нейронну мережу DALL-E у 2019 році, коли отримала грант сумою в 1 млрд дол. від компанії Microsoft на розробку інноваційних технологій у сфері штучного інтелекту. У результаті розробка тривала два роки, а перша версія нейромережі була представлена світовій спільноті 5 січня 2021 року.
Ще за рік, 6 квітня 2022 року, була анонсована нова версія DALL-E — DALL-E 2. Продовження розробки стало можливим завдяки тому, що аудиторія добре зустріла її першу версію. 20 липня 2022 року версія DALL-E 2 ввійшла у фазу бета-тестування за запрошеннями, надісланими одному мільйону попередньо зареєстрованих осіб. З огляду на можливі етичні питання й проблеми, пов'язані безпекою, доступ був заздалегідь обмежений і надавався лише попередньо зареєстрованим користувачам. У новій версії програми були доопрацьовані алгоритми, що дало змогу створювати фотореалістичні зображення, а також додано редактор, що дає змогу змінювати згенеровані зображення.
Приклад роботи нейронної мережі продемонстрував журнал Cosmopolitan, використавши DALL-E 2 для створення обкладинки одного з випусків свого журналу.
Технологія
Нейронну модель GPT (породжувальний попередньо тренований трансформер), розроблену на основі архітектури «трансформер», компанія OpenAI випустила у 2018 році. У 2019 році з'явилася GPT-2 — розширений варіант першої версії. У 2020 році вийшла GPT-3 — ще більш розширена версія зі 175 млрд параметрів. Модель DALL-E — це багатомодальна реалізація GPT-3 із 12 млрд параметрів, яка «заміняє текст на пікселі», натренована на парах текст-зображення, узятих з інтернету. DALL-E 2 використовує 3,5 млрд параметрів — менше, ніж її попередниця.
DALL-E була розроблена й представлена публіці разом із моделлю CLIP (Contrastive Language-Image Pre-training — порівняльне тренування мовних зображень). CLIP — це окрема модель, створена в результаті так званого навчання без джерел (zero-shot learning). Вона натренована на 400 млн пар зображень із текстовими описами, узятими в інтернеті. Її задача — «зрозуміти й класифікувати» результат робити DALL-E шляхом визначення того, який саме опис із 32 768 (215), вибраних випадково з набору даних (у якому один є правильною відповіддю) найкраще відповідає зображенню. Ця модель використовується для відсіювання великого початкового списку зображень, згенерованих мережею DALL-E, з метою вибрати найвідповідніші з них.
DALL-E 2 використовує модель розсіювання на вбудованих зображеннях CLIP, які створюються на основі вбудованих текстових описів моделі CLIP за попередньою моделлю.
Можливості
Мережа DALL-E здатна створювати зображення багатьма стилями, зокрема фотореалістичні, мальовничі та емодзі. Вона спроможна «впорядковувати й змінювати» об'єкти на своїх зображеннях" і правильно розміщувати предмети й «дійових осіб» сцени, не маючи чітких інструкцій. Том Данн (Thom Dunn) на сайті BoingBoing зазначив:
Наприклад, коли просиш її намалювати редьку-дайкон, яка сякається, ковтаючи латте, або катається на одноколісному велосипеді, DALL-E часто малює носовичок, руки й ноги в імовірних місцях.
DALL-E продемонструвала вміння «заповнювати прогалини» з урахуванням контексту. Вона вигадує деталі без специфічних запитів — наприклад, додає різдвяні предмети на зображення, які зазвичай асоціюються зі святкуванням, або належним чином промальовує тіні, хоча такого завдання не ставилося. Крім того, DALL-E показує «добре знається» на тенденціях візуалізації й дизайну.
DALL-E здатна генерувати зображення за найрізноманітнішими варіантами вільного опису, і помилки трапляються рідко. Марк Рідл (Mark Riedl), ад'юнкт-професор Школи інтерактивних обчислень Технологічного інституту Джорджії, виявив, що DALL-E здатна поєднувати концепції. Це вважається ключовим елементом людської творчості.
Її «візуальних розумових здатностей» достатньо, щоб пройти тест Равена (за допомогою візуальних тестів часто вимірюють розумові здібності людини).
Проблеми етичного характеру
Гендерний перекіс
Той факт, що модель DALL-E 2 була натренована на загальнодоступних даних з інтернету, впливає на результати його роботи і в деяких випадках зумовлює алгоритмічне упередження. Наприклад, якщо в запиті не згадується стать людини, модель генерує більше зображень чоловіків, ніж жінок.
Дані, на яких тренували DALL-E 2, фільтрувалися: з них усували картинки, на яких зображено насильство й сексуальні образи. Проте з'ясувалося, що подекуди це призвело навіть до посилення упередженості моделі, — як-от зменшення частоти зображень жінок. У компанії OpenAI припускають, що в даних, на основі яких здійснювалося тренування моделі, жінки часто виявлялись об'єктом сексуальної об'єктивації, і видалення таких даних вплинуло на роботу фільтра.
Діпфейки
Проблема, яка виникає у зв'язку з появою нейронних мереж для генерації зображень, як-от DALL-E 2 і подібних, полягає в тому, що їх можна використовувати для генерації діпфейків та інших різновидів дезінформації. У рамках боротьби з неналежним використанням ПЗ відкидає запити, у яких згадуються публічні особи, і завантаження зображень, які містять людські обличчя. Запити, які містять потенційно небажаний зміст, блокуються, а вивантажені зображення аналізуються на наявність образливого контенту. Недоліком фільтрування запитів є те, що його легко обійти за допомогою синонімічних фраз, які призводять до подібних результатів. Наприклад, слово «кров» фільтрується, а «кетчуп» і «червона рідина» — ні.
Технологічне безробіття
Ще одна проблема, пов'язана з DALL-E 2 і подібними моделями, полягає в тому, що їхня точність і популярність здатні призвести до технологічного безробіття художників, фотографів і графічних дизайнерів.
Технічні обмеження
Розуміння природної мови моделлю DALL-E 2 не є абсолютним. Вона нездатна відрізнити запит «жовта книга і червона ваза» від «червона книга і жовта ваза» або «панда, яка малює лате», від «лате, намальоване пандою». Запит «кінь верхи на космонавті» вона трактує як «астронавт верхи на коні». Крім того, за деяких обставин вона не може згенерувати правильні зображення. Запити, у яких згадується більше трьох об'єктів, які містять заперечення, кількості або речення, з'єднані сполучником, можуть призвести до помилок, а властивості одних об'єктів — перейти на інші. Додатковими обмеженнями є також неспроможність нейронної мережі розуміти наукові терміни, як-от астрономічні або медичні.
Прийом
Найчастіше результати роботи DALL-E характеризують як «сюрреалістичні» та «примхливі». Зображення, яке DALL-E згенерувала у відповідь на запит «an illustration of a baby daikon radish in a tutu walking a dog» (зображення дитини редьки-дайкона, яка вигулює собаку, у пачці балерини), згадувалося в публікаціях Input, NBC, Nature та інших. Часто згадували також зображення «an armchair in the shape of an avocado» (крісло у формі авокадо).
ExtremeTech заявив:
Можна запитати DALL-E зобразити телефон або пилосос із указаного періоду часу: вона розуміє, як змінювалися ці предмети.
Engadget помітив також надзвичайну здатність «розуміти, як телефони та інші предмети змінюються з часом».
MIT Technology Review зауважив, що однією з цілей компанії OpenAI було «надати мовним моделям краще уявлення про буденні поняття, які люди використовують для розуміння речей».
Реалізації з відкритим кодом
Здійснено кілька спроб створити реалізацію DALL-E з відкритим кодом. У 2022 році випущено нейронну мережу Craiyon. Спершу вона називалася DALL-E Mini, але невдовзі, у червні 2022 року, компанія OpenAI надіслала запит на зміну цього імені. Це ШІ-модель, заснована на оригінальній DALL-E, але натренована на нефільтрованих даних з інтернету. У 2022 році вона привернула велику увагу ЗМІ, оскільки створювала вельми смішні зображення.
Див. також
Примітки
- Microsoft Invests In and Partners with OpenAI to Support Us Building Beneficial AGI. OpenAI (англ.). 22 червня 2019.
- Johnson, Khari (5 січня 2021). OpenAI debuts DALL-E for generating images from text. VentureBeat. оригіналу за 5 січня 2021. Процитовано 5 січня 2021.
- DALL·E 2. OpenAI (англ.). Процитовано 6 липня 2022.
- Sahar Mor, Stripe (16 квітня 2022). How DALL-E 2 could solve major computer vision challenges. VentureBeat. оригіналу за 24 травня 2022. Процитовано 15 червня 2022.
- Knight, Will. Inside DALL-E Mini, the Internet's Favorite AI Meme Machine. Wired (амер.). ISSN 1059-1028. Процитовано 6 липня 2022.
- Midjourney. Midjourney (англ.). Процитовано 20 липня 2022.
- Coldewey, Devin (5 січня 2021). OpenAI's DALL-E creates plausible images of literally anything you ask it to. оригіналу за 6 січня 2021. Процитовано 5 січня 2021.
- DALL·E Now Available in Beta. OpenAI (англ.). 20 липня 2022. Процитовано 20 липня 2022.
- Allyn, Bobby (20 липня 2022). Surreal or too real? Breathtaking AI tool DALL-E takes its images to a bigger stage. NPR (англ.). Процитовано 20 липня 2022.
- DALL·E Waitlist. labs.openai.com (англ.). Процитовано 6 липня 2022.
- From Trump Nevermind babies to deep fakes: DALL-E and the ethics of AI art. the Guardian (англ.). 18 червня 2022. Процитовано 6 липня 2022.
- Hope Corrigan (1 липня 2022). Photographer uses DALL-E 2 AI to automatically edit images better than Photoshop. PC Gamer (англ.).
- Gloria Liu (21 червня 2022). The World’s Smartest Artificial Intelligence Just Made Its First Magazine Cover. Cosmopolitan (англ.).
- Radford, Alec; Narasimhan, Karthik; Salimans, Tim; Sutskever, Ilya (11 червня 2018). Improving Language Understanding by Generative Pre-Training (PDF). OpenAI. с. 12. (PDF) оригіналу за 26 січня 2021. Процитовано 23 січня 2021.
- Radford, Alec; Wu, Jeffrey; Child, Rewon; Luan, David; Amodei, Dario; Sutskever, Ilua (14 лютого 2019). Language models are unsupervised multitask learners (PDF). 1 (8). (PDF) оригіналу за 6 лютого 2021. Процитовано 19 грудня 2020.
- Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (22 липня 2020). Language Models are Few-Shot Learners. arXiv:2005.14165 [cs.CL].
- Ramesh, Aditya; Pavlov, Mikhail; Goh, Gabriel; Gray, Scott; Voss, Chelsea; Radford, Alec; Chen, Mark; Sutskever, Ilya (24 лютого 2021). Zero-Shot Text-to-Image Generation. arXiv:2102.12092 [cs.LG].
- Tamkin, Alex; Brundage, Miles; Clark, Jack; Ganguli, Deep (2021). Understanding the Capabilities, Limitations, and Societal Impact of Large Language Models. arXiv:2102.02503 [cs.CL].
- Heaven, Will Douglas (5 січня 2021). This avocado armchair could be the future of AI. MIT Technology Review. Процитовано 5 січня 2021.
- Ramesh, Aditya; Dhariwal, Prafulla; Nichol, Alex; Chu, Casey; Chen, Mark (12 квітня 2022). Hierarchical Text-Conditional Image Generation with CLIP Latents. arXiv:2204.06125.
- 'DALL-E' AI generates an image out of anything you describe. Engadget (амер.). Процитовано 18 липня 2022.
- Dunn, Thom (10 лютого 2021). This AI neural network transforms text captions into art, like a jellyfish Pikachu. . оригіналу за 22 лютого 2021. Процитовано 2 березня 2021.
- Whitwam, Ryan (6 січня 2021). OpenAI's 'DALL-E' Generates Images From Text Descriptions. ExtremeTech. оригіналу за 28 січня 2021. Процитовано 2 березня 2021.
- Dent, Steve (6 січня 2021). OpenAI's DALL-E app generates images from just a description. Engadget. оригіналу за 27 січня 2021. Процитовано 2 березня 2021.
- Marcus, Gary; Davis, Ernest; Aaronson, Scott (2 травня 2022). A very preliminary analysis of DALL-E 2. arXiv:2204.13807 [cs.CV].
- Shead, Sam (8 січня 2021). Why everyone is talking about an image generator released by an Elon Musk-backed A.I. lab. CNBC. Процитовано 2 березня 2021.
- Wakefield, Jane (6 січня 2021). AI draws dog-walking baby radish in a tutu. British Broadcasting Corporation. оригіналу за 2 березня 2021. Процитовано 3 березня 2021.
- Markowitz, Dale (10 січня 2021). Here's how OpenAI's magical DALL-E image generator works. . оригіналу за 23 лютого 2021. Процитовано 2 березня 2021.
- DALL·E: Creating Images from Text. OpenAI (англ.). 5 січня 2021. Процитовано 13 серпня 2022.
- STRICKLAND, ELIZA (14 липня 2022). DALL-E 2's Failures Are the Most Interesting Thing About It. IEEE Spectrum (англ.). Процитовано 15 липня 2022.
- DALL·E 2 Pre-Training Mitigations. OpenAI (англ.). 28 червня 2022. Процитовано 18 липня 2022.
- Taylor, Josh (18 червня 2022). From Trump Nevermind babies to deep fakes: DALL-E and the ethics of AI art. The Guardian. Процитовано 2 серпня 2022.
- Knight, Will (13 липня 2022). When AI Makes Art, Humans Supply the Creative Spark. Wired. Процитовано 2 серпня 2022.
- Rose, Janus (24 червня 2022). DALL-E Is Now Generating Realistic Faces of Fake People. Vice. Процитовано 2 серпня 2022.
- OpenAI (19 червня 2022). DALL·E 2 Preview - Risks and Limitations. GitHub. Процитовано 2 серпня 2022.
- Lane, Laura (1 липня 2022). DALL-E, Make Me Another Picasso, Please. The New Yorker. Процитовано 2 серпня 2022.
- Goldman, Sharon. OpenAI: Will DALLE-2 kill creative careers?.
- Blain, Loz. DALL-E 2: A dream tool and an existential threat to visual artists.
- Saharia, Chitwan; Chan, William; Saxena, Saurabh; Li, Lala; Whang, Jay; Denton, Emily; Ghasemipour, Seyed Kamyar Seyed; Ayan, Burcu Karagol; Mahdavi, S. Sara; Lopes, Rapha Gontijo; Salimans, Tim (23 травня 2022). Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding. arXiv:2205.11487 [cs.CV].
- Marcus, Gary (28 травня 2022). Horse rides astronaut. The Road to AI We Can Trust. Процитовано 18 червня 2022.
- Strickland, Eliza (14 липня 2022). DALL-E 2's Failures Are the Most Interesting Thing About It. IEEE Spectrum (англ.). Процитовано 16 серпня 2022.
- Kasana, Mehreen (7 січня 2021). This AI turns text into surreal, suggestion-driven art. Input. оригіналу за 29 січня 2021. Процитовано 2 березня 2021.
- Ehrenkranz, Melanie (27 січня 2021). Here's DALL-E: An algorithm learned to draw anything you tell it. NBC News. оригіналу за 20 лютого 2021. Процитовано 2 березня 2021.
- Stove, Emma (5 лютого 2021). Tardigrade circus and a tree of life — January's best science images. Nature. оригіналу за 8 березня 2021. Процитовано 2 березня 2021.
- Knight, Will (26 січня 2021). This AI Could Go From 'Art' to Steering a Self-Driving Car. Wired. оригіналу за 21 лютого 2021. Процитовано 2 березня 2021.
- Metz, Rachel (2 лютого 2021). A radish in a tutu walking a dog? This AI can draw it really well. CNN. Процитовано 2 березня 2021.
- jina-ai/dalle-flow, Jina AI, 17 червня 2022, процитовано 17 червня 2022
- Carson, Erin (14 червня 2022). Everything to Know About Dall-E Mini, the Mind-Bending AI Art Creator. CNET. оригіналу за 15 червня 2022. Процитовано 15 червня 2022.
- Schroeder, Audra (9 червня 2022). AI program DALL-E mini prompts some truly cursed images. . оригіналу за 10 червня 2022. Процитовано 15 червня 2022.
- Diaz, Ana (15 червня 2022). People are using DALL-E mini to make meme abominations — like pug Pikachu. Polygon. оригіналу за 15 червня 2022. Процитовано 15 червня 2022.
- Nichele, Stefano (2021). Tim Taylor and Alan Dorin: Rise of the self-replicators—early visions of machines, AI and robots that can reproduce and evolve. Genetic Programming and Evolvable Machines. 22: 141—145. doi:10.1007/s10710-021-09398-5. S2CID 231930573.
- Macaulay, Thomas (6 січня 2021). Say hello to OpenAI's DALL-E, a GPT-3-powered bot that creates weird images from text. . оригіналу за 28 січня 2021. Процитовано 2 березня 2021.
- Andrei, Mihai (8 січня 2021). This AI module can create stunning images out of any text input. ZME Science. оригіналу за 29 січня 2021. Процитовано 2 березня 2021.
- Grossman, Gary (16 січня 2021). OpenAI's text-to-image engine, DALL-E, is a powerful visual idea generator. VentureBeat. оригіналу за 26 лютого 2021. Процитовано 2 березня 2021.
- Toews, Rob (18 січня 2021). AI And Creativity: Why OpenAI's Latest Model Matters. Forbes. оригіналу за 12 лютого 2021. Процитовано 2 березня 2021.
- Walsh, Bryan (5 січня 2021). A new AI model draws images from text. . Процитовано 2 березня 2021.
- For Its Latest Trick, OpenAI's GPT-3 Generates Images From Text Captions. Synced. 5 січня 2021. оригіналу за 6 січня 2021. Процитовано 2 березня 2021.
Посилання
- Вебсайт Craiyon
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
DALL E stilizovanij zapis DALL E a takozh DALL E 2 stvoreni shlyahom mashinnogo navchannya nejronni modeli rozrobleni kompaniyeyu OpenAI za finansovoyi pidtrimki Microsoft priznacheni dlya stvorennya cifrovih zobrazhen na osnovi opisiv prirodnoyu movoyu zvanih pidkazkami Kompaniya OpenAI predstavila nejronnu merezhu DALL E u svoyemu blozi v sichni 2021 roku DALL E vikoristovuye movnu model GPT 3 modifikovanu dlya generaciyi zobrazhen U kvitni 2022 roku kompaniya OpenAI predstavila DALL E 2 nastupnu versiyu svogo produktu rozroblenu dlya stvorennya realistichnishih zobrazhen yaki mayut vishu rozdilnu zdatnist i zdatni poyednuvati koncepciyi atributi j stili Zobrazhennya zgenerovane DALL E za zapitom Fotografiya robota sho malyuye vruchnu cifrove mistectvo OpenAI ne opublikuvala pochatkovij kod svoyih modelej ale zobrazhennya zgenerovani na osnovi obmezhenogo naboru probnih zapitiv mozhna otrimati na yiyi vebsajti Nezvazhayuchi na ce v interneti z yavilosya kilka emulyacij iz vidkritim kodom stvorenih na menshomu obsyazi danih Nazva DALL E ce kontaminaciya imen VOLL I WALL E multiplikacijnogo personazha kompaniyi Pixar ta ispanskogo hudozhnika syurrealista Salvadora Dali IstoriyaKompaniya OpenAI pochala rozroblyati nejronnu merezhu DALL E u 2019 roci koli otrimala grant sumoyu v 1 mlrd dol vid kompaniyi Microsoft na rozrobku innovacijnih tehnologij u sferi shtuchnogo intelektu U rezultati rozrobka trivala dva roki a persha versiya nejromerezhi bula predstavlena svitovij spilnoti 5 sichnya 2021 roku She za rik 6 kvitnya 2022 roku bula anonsovana nova versiya DALL E DALL E 2 Prodovzhennya rozrobki stalo mozhlivim zavdyaki tomu sho auditoriya dobre zustrila yiyi pershu versiyu 20 lipnya 2022 roku versiya DALL E 2 vvijshla u fazu beta testuvannya za zaproshennyami nadislanimi odnomu miljonu poperedno zareyestrovanih osib Z oglyadu na mozhlivi etichni pitannya j problemi pov yazani bezpekoyu dostup buv zazdalegid obmezhenij i nadavavsya lishe poperedno zareyestrovanim koristuvacham U novij versiyi programi buli doopracovani algoritmi sho dalo zmogu stvoryuvati fotorealistichni zobrazhennya a takozh dodano redaktor sho daye zmogu zminyuvati zgenerovani zobrazhennya Priklad roboti nejronnoyi merezhi prodemonstruvav zhurnal Cosmopolitan vikoristavshi DALL E 2 dlya stvorennya obkladinki odnogo z vipuskiv svogo zhurnalu TehnologiyaNejronnu model GPT porodzhuvalnij poperedno trenovanij transformer rozroblenu na osnovi arhitekturi transformer kompaniya OpenAI vipustila u 2018 roci U 2019 roci z yavilasya GPT 2 rozshirenij variant pershoyi versiyi U 2020 roci vijshla GPT 3 she bilsh rozshirena versiya zi 175 mlrd parametriv Model DALL E ce bagatomodalna realizaciya GPT 3 iz 12 mlrd parametriv yaka zaminyaye tekst na pikseli natrenovana na parah tekst zobrazhennya uzyatih z internetu DALL E 2 vikoristovuye 3 5 mlrd parametriv menshe nizh yiyi poperednicya DALL E bula rozroblena j predstavlena publici razom iz modellyu CLIP Contrastive Language Image Pre training porivnyalne trenuvannya movnih zobrazhen CLIP ce okrema model stvorena v rezultati tak zvanogo navchannya bez dzherel zero shot learning Vona natrenovana na 400 mln par zobrazhen iz tekstovimi opisami uzyatimi v interneti Yiyi zadacha zrozumiti j klasifikuvati rezultat robiti DALL E shlyahom viznachennya togo yakij same opis iz 32 768 215 vibranih vipadkovo z naboru danih u yakomu odin ye pravilnoyu vidpoviddyu najkrashe vidpovidaye zobrazhennyu Cya model vikoristovuyetsya dlya vidsiyuvannya velikogo pochatkovogo spisku zobrazhen zgenerovanih merezheyu DALL E z metoyu vibrati najvidpovidnishi z nih DALL E 2 vikoristovuye model rozsiyuvannya na vbudovanih zobrazhennyah CLIP yaki stvoryuyutsya na osnovi vbudovanih tekstovih opisiv modeli CLIP za poperednoyu modellyu MozhlivostiZobrazhennya zgenerovane DALL E za zapitom Multyashna kachka yaka shukaye prigod u labirinti Merezha DALL E zdatna stvoryuvati zobrazhennya bagatma stilyami zokrema fotorealistichni malovnichi ta emodzi Vona spromozhna vporyadkovuvati j zminyuvati ob yekti na svoyih zobrazhennyah i pravilno rozmishuvati predmeti j dijovih osib sceni ne mayuchi chitkih instrukcij Tom Dann Thom Dunn na sajti BoingBoing zaznachiv Napriklad koli prosish yiyi namalyuvati redku dajkon yaka syakayetsya kovtayuchi latte abo katayetsya na odnokolisnomu velosipedi DALL E chasto malyuye nosovichok ruki j nogi v imovirnih miscyah DALL E prodemonstruvala vminnya zapovnyuvati progalini z urahuvannyam kontekstu Vona vigaduye detali bez specifichnih zapitiv napriklad dodaye rizdvyani predmeti na zobrazhennya yaki zazvichaj asociyuyutsya zi svyatkuvannyam abo nalezhnim chinom promalovuye tini hocha takogo zavdannya ne stavilosya Krim togo DALL E pokazuye dobre znayetsya na tendenciyah vizualizaciyi j dizajnu DALL E zdatna generuvati zobrazhennya za najriznomanitnishimi variantami vilnogo opisu i pomilki traplyayutsya ridko Mark Ridl Mark Riedl ad yunkt profesor Shkoli interaktivnih obchislen Tehnologichnogo institutu Dzhordzhiyi viyaviv sho DALL E zdatna poyednuvati koncepciyi Ce vvazhayetsya klyuchovim elementom lyudskoyi tvorchosti Yiyi vizualnih rozumovih zdatnostej dostatno shob projti test Ravena za dopomogoyu vizualnih testiv chasto vimiryuyut rozumovi zdibnosti lyudini Problemi etichnogo harakteru Gendernij perekis Toj fakt sho model DALL E 2 bula natrenovana na zagalnodostupnih danih z internetu vplivaye na rezultati jogo roboti i v deyakih vipadkah zumovlyuye algoritmichne uperedzhennya Napriklad yaksho v zapiti ne zgaduyetsya stat lyudini model generuye bilshe zobrazhen cholovikiv nizh zhinok Dani na yakih trenuvali DALL E 2 filtruvalisya z nih usuvali kartinki na yakih zobrazheno nasilstvo j seksualni obrazi Prote z yasuvalosya sho podekudi ce prizvelo navit do posilennya uperedzhenosti modeli yak ot zmenshennya chastoti zobrazhen zhinok U kompaniyi OpenAI pripuskayut sho v danih na osnovi yakih zdijsnyuvalosya trenuvannya modeli zhinki chasto viyavlyalis ob yektom seksualnoyi ob yektivaciyi i vidalennya takih danih vplinulo na robotu filtra Dipfejki Problema yaka vinikaye u zv yazku z poyavoyu nejronnih merezh dlya generaciyi zobrazhen yak ot DALL E 2 i podibnih polyagaye v tomu sho yih mozhna vikoristovuvati dlya generaciyi dipfejkiv ta inshih riznovidiv dezinformaciyi U ramkah borotbi z nenalezhnim vikoristannyam PZ vidkidaye zapiti u yakih zgaduyutsya publichni osobi i zavantazhennya zobrazhen yaki mistyat lyudski oblichchya Zapiti yaki mistyat potencijno nebazhanij zmist blokuyutsya a vivantazheni zobrazhennya analizuyutsya na nayavnist obrazlivogo kontentu Nedolikom filtruvannya zapitiv ye te sho jogo legko obijti za dopomogoyu sinonimichnih fraz yaki prizvodyat do podibnih rezultativ Napriklad slovo krov filtruyetsya a ketchup i chervona ridina ni Tehnologichne bezrobittya She odna problema pov yazana z DALL E 2 i podibnimi modelyami polyagaye v tomu sho yihnya tochnist i populyarnist zdatni prizvesti do tehnologichnogo bezrobittya hudozhnikiv fotografiv i grafichnih dizajneriv Tehnichni obmezhennya Rozuminnya prirodnoyi movi modellyu DALL E 2 ne ye absolyutnim Vona nezdatna vidrizniti zapit zhovta kniga i chervona vaza vid chervona kniga i zhovta vaza abo panda yaka malyuye late vid late namalovane pandoyu Zapit kin verhi na kosmonavti vona traktuye yak astronavt verhi na koni Krim togo za deyakih obstavin vona ne mozhe zgeneruvati pravilni zobrazhennya Zapiti u yakih zgaduyetsya bilshe troh ob yektiv yaki mistyat zaperechennya kilkosti abo rechennya z yednani spoluchnikom mozhut prizvesti do pomilok a vlastivosti odnih ob yektiv perejti na inshi Dodatkovimi obmezhennyami ye takozh nespromozhnist nejronnoyi merezhi rozumiti naukovi termini yak ot astronomichni abo medichni PrijomRealistichne zobrazhennya zebri zhirafi zgenerovane DALL E Najchastishe rezultati roboti DALL E harakterizuyut yak syurrealistichni ta primhlivi Zobrazhennya yake DALL E zgeneruvala u vidpovid na zapit an illustration of a baby daikon radish in a tutu walking a dog zobrazhennya ditini redki dajkona yaka vigulyuye sobaku u pachci balerini zgaduvalosya v publikaciyah Input NBC Nature ta inshih Chasto zgaduvali takozh zobrazhennya an armchair in the shape of an avocado krislo u formi avokado ExtremeTech zayaviv Mozhna zapitati DALL E zobraziti telefon abo pilosos iz ukazanogo periodu chasu vona rozumiye yak zminyuvalisya ci predmeti Engadget pomitiv takozh nadzvichajnu zdatnist rozumiti yak telefoni ta inshi predmeti zminyuyutsya z chasom MIT Technology Review zauvazhiv sho odniyeyu z cilej kompaniyi OpenAI bulo nadati movnim modelyam krashe uyavlennya pro budenni ponyattya yaki lyudi vikoristovuyut dlya rozuminnya rechej Realizaciyi z vidkritim kodomZdijsneno kilka sprob stvoriti realizaciyu DALL E z vidkritim kodom U 2022 roci vipusheno nejronnu merezhu Craiyon Spershu vona nazivalasya DALL E Mini ale nevdovzi u chervni 2022 roku kompaniya OpenAI nadislala zapit na zminu cogo imeni Ce ShI model zasnovana na originalnij DALL E ale natrenovana na nefiltrovanih danih z internetu U 2022 roci vona privernula veliku uvagu ZMI oskilki stvoryuvala velmi smishni zobrazhennya Div takozhMidjourney Imagen Google Brain Zhivopis na osnovi shtuchnogo intelektuPrimitkiMicrosoft Invests In and Partners with OpenAI to Support Us Building Beneficial AGI OpenAI angl 22 chervnya 2019 Johnson Khari 5 sichnya 2021 OpenAI debuts DALL E for generating images from text VentureBeat originalu za 5 sichnya 2021 Procitovano 5 sichnya 2021 DALL E 2 OpenAI angl Procitovano 6 lipnya 2022 Sahar Mor Stripe 16 kvitnya 2022 How DALL E 2 could solve major computer vision challenges VentureBeat originalu za 24 travnya 2022 Procitovano 15 chervnya 2022 Knight Will Inside DALL E Mini the Internet s Favorite AI Meme Machine Wired amer ISSN 1059 1028 Procitovano 6 lipnya 2022 Midjourney Midjourney angl Procitovano 20 lipnya 2022 Coldewey Devin 5 sichnya 2021 OpenAI s DALL E creates plausible images of literally anything you ask it to originalu za 6 sichnya 2021 Procitovano 5 sichnya 2021 DALL E Now Available in Beta OpenAI angl 20 lipnya 2022 Procitovano 20 lipnya 2022 Allyn Bobby 20 lipnya 2022 Surreal or too real Breathtaking AI tool DALL E takes its images to a bigger stage NPR angl Procitovano 20 lipnya 2022 DALL E Waitlist labs openai com angl Procitovano 6 lipnya 2022 From Trump Nevermind babies to deep fakes DALL E and the ethics of AI art the Guardian angl 18 chervnya 2022 Procitovano 6 lipnya 2022 Hope Corrigan 1 lipnya 2022 Photographer uses DALL E 2 AI to automatically edit images better than Photoshop PC Gamer angl Gloria Liu 21 chervnya 2022 The World s Smartest Artificial Intelligence Just Made Its First Magazine Cover Cosmopolitan angl Radford Alec Narasimhan Karthik Salimans Tim Sutskever Ilya 11 chervnya 2018 Improving Language Understanding by Generative Pre Training PDF OpenAI s 12 PDF originalu za 26 sichnya 2021 Procitovano 23 sichnya 2021 Radford Alec Wu Jeffrey Child Rewon Luan David Amodei Dario Sutskever Ilua 14 lyutogo 2019 Language models are unsupervised multitask learners PDF 1 8 PDF originalu za 6 lyutogo 2021 Procitovano 19 grudnya 2020 Brown Tom B Mann Benjamin Ryder Nick Subbiah Melanie Kaplan Jared Dhariwal Prafulla Neelakantan Arvind Shyam Pranav Sastry Girish Askell Amanda Agarwal Sandhini Herbert Voss Ariel Krueger Gretchen Henighan Tom Child Rewon Ramesh Aditya Ziegler Daniel M Wu Jeffrey Winter Clemens Hesse Christopher Chen Mark Sigler Eric Litwin Mateusz Gray Scott Chess Benjamin Clark Jack Berner Christopher McCandlish Sam Radford Alec Sutskever Ilya Amodei Dario 22 lipnya 2020 Language Models are Few Shot Learners arXiv 2005 14165 cs CL Ramesh Aditya Pavlov Mikhail Goh Gabriel Gray Scott Voss Chelsea Radford Alec Chen Mark Sutskever Ilya 24 lyutogo 2021 Zero Shot Text to Image Generation arXiv 2102 12092 cs LG Tamkin Alex Brundage Miles Clark Jack Ganguli Deep 2021 Understanding the Capabilities Limitations and Societal Impact of Large Language Models arXiv 2102 02503 cs CL Heaven Will Douglas 5 sichnya 2021 This avocado armchair could be the future of AI MIT Technology Review Procitovano 5 sichnya 2021 Ramesh Aditya Dhariwal Prafulla Nichol Alex Chu Casey Chen Mark 12 kvitnya 2022 Hierarchical Text Conditional Image Generation with CLIP Latents arXiv 2204 06125 DALL E AI generates an image out of anything you describe Engadget amer Procitovano 18 lipnya 2022 Dunn Thom 10 lyutogo 2021 This AI neural network transforms text captions into art like a jellyfish Pikachu originalu za 22 lyutogo 2021 Procitovano 2 bereznya 2021 Whitwam Ryan 6 sichnya 2021 OpenAI s DALL E Generates Images From Text Descriptions ExtremeTech originalu za 28 sichnya 2021 Procitovano 2 bereznya 2021 Dent Steve 6 sichnya 2021 OpenAI s DALL E app generates images from just a description Engadget originalu za 27 sichnya 2021 Procitovano 2 bereznya 2021 Marcus Gary Davis Ernest Aaronson Scott 2 travnya 2022 A very preliminary analysis of DALL E 2 arXiv 2204 13807 cs CV Shead Sam 8 sichnya 2021 Why everyone is talking about an image generator released by an Elon Musk backed A I lab CNBC Procitovano 2 bereznya 2021 Wakefield Jane 6 sichnya 2021 AI draws dog walking baby radish in a tutu British Broadcasting Corporation originalu za 2 bereznya 2021 Procitovano 3 bereznya 2021 Markowitz Dale 10 sichnya 2021 Here s how OpenAI s magical DALL E image generator works originalu za 23 lyutogo 2021 Procitovano 2 bereznya 2021 DALL E Creating Images from Text OpenAI angl 5 sichnya 2021 Procitovano 13 serpnya 2022 STRICKLAND ELIZA 14 lipnya 2022 DALL E 2 s Failures Are the Most Interesting Thing About It IEEE Spectrum angl Procitovano 15 lipnya 2022 DALL E 2 Pre Training Mitigations OpenAI angl 28 chervnya 2022 Procitovano 18 lipnya 2022 Taylor Josh 18 chervnya 2022 From Trump Nevermind babies to deep fakes DALL E and the ethics of AI art The Guardian Procitovano 2 serpnya 2022 Knight Will 13 lipnya 2022 When AI Makes Art Humans Supply the Creative Spark Wired Procitovano 2 serpnya 2022 Rose Janus 24 chervnya 2022 DALL E Is Now Generating Realistic Faces of Fake People Vice Procitovano 2 serpnya 2022 OpenAI 19 chervnya 2022 DALL E 2 Preview Risks and Limitations GitHub Procitovano 2 serpnya 2022 Lane Laura 1 lipnya 2022 DALL E Make Me Another Picasso Please The New Yorker Procitovano 2 serpnya 2022 Goldman Sharon OpenAI Will DALLE 2 kill creative careers Blain Loz DALL E 2 A dream tool and an existential threat to visual artists Saharia Chitwan Chan William Saxena Saurabh Li Lala Whang Jay Denton Emily Ghasemipour Seyed Kamyar Seyed Ayan Burcu Karagol Mahdavi S Sara Lopes Rapha Gontijo Salimans Tim 23 travnya 2022 Photorealistic Text to Image Diffusion Models with Deep Language Understanding arXiv 2205 11487 cs CV Marcus Gary 28 travnya 2022 Horse rides astronaut The Road to AI We Can Trust Procitovano 18 chervnya 2022 Strickland Eliza 14 lipnya 2022 DALL E 2 s Failures Are the Most Interesting Thing About It IEEE Spectrum angl Procitovano 16 serpnya 2022 Kasana Mehreen 7 sichnya 2021 This AI turns text into surreal suggestion driven art Input originalu za 29 sichnya 2021 Procitovano 2 bereznya 2021 Ehrenkranz Melanie 27 sichnya 2021 Here s DALL E An algorithm learned to draw anything you tell it NBC News originalu za 20 lyutogo 2021 Procitovano 2 bereznya 2021 Stove Emma 5 lyutogo 2021 Tardigrade circus and a tree of life January s best science images Nature originalu za 8 bereznya 2021 Procitovano 2 bereznya 2021 Knight Will 26 sichnya 2021 This AI Could Go From Art to Steering a Self Driving Car Wired originalu za 21 lyutogo 2021 Procitovano 2 bereznya 2021 Metz Rachel 2 lyutogo 2021 A radish in a tutu walking a dog This AI can draw it really well CNN Procitovano 2 bereznya 2021 jina ai dalle flow Jina AI 17 chervnya 2022 procitovano 17 chervnya 2022 Carson Erin 14 chervnya 2022 Everything to Know About Dall E Mini the Mind Bending AI Art Creator CNET originalu za 15 chervnya 2022 Procitovano 15 chervnya 2022 Schroeder Audra 9 chervnya 2022 AI program DALL E mini prompts some truly cursed images originalu za 10 chervnya 2022 Procitovano 15 chervnya 2022 Diaz Ana 15 chervnya 2022 People are using DALL E mini to make meme abominations like pug Pikachu Polygon originalu za 15 chervnya 2022 Procitovano 15 chervnya 2022 Nichele Stefano 2021 Tim Taylor and Alan Dorin Rise of the self replicators early visions of machines AI and robots that can reproduce and evolve Genetic Programming and Evolvable Machines 22 141 145 doi 10 1007 s10710 021 09398 5 S2CID 231930573 Macaulay Thomas 6 sichnya 2021 Say hello to OpenAI s DALL E a GPT 3 powered bot that creates weird images from text originalu za 28 sichnya 2021 Procitovano 2 bereznya 2021 Andrei Mihai 8 sichnya 2021 This AI module can create stunning images out of any text input ZME Science originalu za 29 sichnya 2021 Procitovano 2 bereznya 2021 Grossman Gary 16 sichnya 2021 OpenAI s text to image engine DALL E is a powerful visual idea generator VentureBeat originalu za 26 lyutogo 2021 Procitovano 2 bereznya 2021 Toews Rob 18 sichnya 2021 AI And Creativity Why OpenAI s Latest Model Matters Forbes originalu za 12 lyutogo 2021 Procitovano 2 bereznya 2021 Walsh Bryan 5 sichnya 2021 A new AI model draws images from text Procitovano 2 bereznya 2021 For Its Latest Trick OpenAI s GPT 3 Generates Images From Text Captions Synced 5 sichnya 2021 originalu za 6 sichnya 2021 Procitovano 2 bereznya 2021 PosilannyaVebsajt Craiyon