Apple создает альтернативу диффузионным нейросетям
- Елена Санникова
- Технологии
- 0 комментарии
Apple опубликовала работу, предлагающую новый подход к генерации видео, способный потеснить диффузионные модели.
Система STARFlow-V построена на архитектуре потоковой нормализации и обучается как единая модель для работы с текстом, картинками и видео.
В отличие от диффузии, требующей множества итераций для денойза, STARFlow-V использует однократное обратимое отображение и строгую причинно-следственную логику. Глобальный блок модели работает авторегрессионно: генерация каждого нового латента зависит исключительно от предыдущих данных.
Для оптимизации скорости вычислений применяется параллельные обновления Якоби, что дает качество уровня SOTA при более высокой стабильности генерации.





