OpenAI представи новата версия на модела за генериране на изображения ChatGPT Images 2.0, който е способен да изобразява текст в изображенията с висока точност. Преди две години, дифузионните модели на изкуствения интелект не успяваха да генерират реалистични текстове, но сега новият модел създава изображения с коректни надписи.
През 2024 г. предишните модели често изкривяваха текстовете. Според Асмелаш Тека Хадгу от Lesan AI, те реконструират изображенията от шум и покриват основната част от пикселите, като текстът остава малко видим.
Изследователите започнаха да експериментират с авторегресионни модели, които предсказват съдържанието на изображенията, подобно на големите езикови модели (LLM).
OpenAI не разкрива детайли за архитектурата на Images 2.0. Според компанията, новият модел може да







Leave feedback about this
Трябва да влезете, за да публикувате коментар.