В 1906 году братья Майльз выпустили документальный фильм Поездка по Маркет-стрит, снятый в Сан-Франциско в начале XX века.
Спустя чуть более ста лет Денис Ширяев превратил фильм во что-то ещё более волшебное.
Используя различные алгоритмы, Ширяев раскрасил видео, увеличил резкость пленки до 4K, а количество FPS до 60.
Это нельзя назвать реставрацией фильма, поскольку алгоритмы не только избавляют картинку от недостатков, но еще добавляют недостающие детали, которые изначально отсутствовали на пленке.
Мы называем это улучшением, потому что тренируем нейросети. И когда нейросети перерисовывают изображения, они добавляют новый слой данных. Следовательно, колоризация является улучшением. Апскейлинг — это улучшение. Кадровая интерполяция — это улучшение.
Денис Ширяев
Алгоритм DeOldify отвечает за цветокоррекцию. Он был обучен на 14 миллионах изображений, чтобы понять, как обычно выглядят различные предметы.
DeOldify распознает определенные объекты, например, траву, деревья и людей в разной одежде. Исходя из своей базы знаний, он автоматически заменяет черно-белые участки на цветные.
Алгоритм не идеален. Он хорошо работает только с объектами, на которых обучался, поэтому бывают ситуации, когда DeOldify подбирает неправильный цвет. Особенно эта проблема характерна для флагов.
Апскейлингом, то есть увеличением разрешения, занимается ESRGAN. Для его обучения использовались парные изображения: одно низкого качества, а другое высокого.
В видео ESRGAN анализирует каждый пиксель и на основе своей базы масштабирует картинку.
Конечно, сверхчетких деталей ждать не стоит, но надписи и крупные объекты выглядят вполне прилично.
Алгоритм DAIN для интерполяции кадров, ищет взаимосвязь между заданным кадром и следующим. Затем он анализирует, как различные объекты меняют положение от одного кадра к другому.
DAIN также может «изучить» современный фильм и увеличить количество FPS с 30 до безумных 480.
Ширяев обрабатывал видео в свободное время. По его словам, в первую очередь он хочет показать, на что способны современные модели машинного обучения.
В общем, я предположил, что если найти на ютубе все черно-белые видео, убрать из них художественные, оставив только документальные, и выбрать там самое популярное видео по просмотрам, оно может стать еще популярнее чем видео с поездом – так я наткнулся на видео с NYC 1911. Гипотеза подтвердилась и оно вызвало еще большую волну в плане хайпа, которую лениво расписывать.
Теперь приходится вечерами пилить какие-то эксперименты с нейронками для будущих видео, потому что я не хочу фокусироваться только на апскейле, но в целом показывать как круто сейчас в мире ML, и как быстро мы оказались в настоящем будущем.
Денис Ширяев
Все алгоритмы бесплатные, поэтому любой желающий может использовать их в своих целях. Для этого придется изучить документацию, а также найти компьютер с Linux и мощной видеокартой.
Графический процессор очень важен. Обработка Поездки по Маркет-стрит заняла почти полмесяца, потому что алгоритмы очень медленные.
Тем не менее, полученный результат точно оправдывает затраченное время.
21 комментариев
Форум →Молодец, толковый парень.
Круть! Большое уважение человеку и за идею и за реализацию!!!
А зная не по наслышке о машинном обучении и ии снимаю шляпу за упорство!!
Браво!
Обладеть насколько другая атмосфера в 1906
Я видел эти видео раньше и каждый раз застываю у экрана. Как??! Как же это возможно? Особенно меня поражает восстановление несуществующих кадров. Там же кадровка была очень скудная. Ладно там восстановить цвет из ЧБ, убрать шум и тд. Это всё равно работа с существующим, а как добивались плавности 60fps?? Это ж надо как-то машину научить восстанавливать промежуточные несуществующие кадры. Вот это очень интересно.
@ibananov2013, обычным матстатом.
@Dmitry T, я бы не называл эту сложнейшую систему вычислений обычной.
@ibananov2013, там нет никакой магии – как решение дифуров численным способом просто за счет мощности компьютера. Несколько ключевых и сложных алгоритмов, но вокруг все довольно таки просто (для инженера, который потратил некоторое время на погружение в проблему).
@ibananov2013, ну 4к здесь номинальное. В 360 pi такая же резкость
Очень интересно как двигаются трамваи без проводов. Кхм
@potatoonair, это Сан-Франциско, там у трамвая вместо подвесного контактного провода, контактный рельс. Он находится посредине между двух обычных рельсов.
Загуглите.
Кстати говоря, даже на этом видео все прекрасно видно.
@ShamanskyRobert, там нет контактного рельса и нет электричества, там трос под мостовой (принцип канатной дороги)
@hzefdxu9zi, спасибо, что просветили!
@hzefdxu9zi, это фантастика
@ShamanskyRobert, Ага, силовой рельс 750 Вольт прям на улице города =)))))
@ShamanskyRobert, контактный рельс? Надеюсь вы представляете себе последствия…
Айфон лучше снимает ))
Всегда думал, что 4К — это разрешение. Но в статье сказано, что 4К — это резкость. Мдя.
“Алгоритм не идеален. Он хорошо работает только с объектами, на которых обучался, поэтому бывают ситуации, когда DeOldify подбирает неправильный цвет. Особенно эта проблема характерна для флагов”
странно, вроде должно быть наоборот же, флаги однозначны, легко идентифицируются, достаточно обучить алгоритм на флагах, и цвета должны подбираться с большой точностью.
@joker2k2, флаги совсем не однозначны – тех же триколоров была и есть тьма-тьмущая. Вот если натаскать на конкретный исторический период с привязкой к местности, то да, промахов будет минимум.
Пост для тех, кто не читает Tjournal. Удивлен, что такие тут есть.
Видел на ютуб это около года назад
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Как на iPhone и iPad отключить автоматический запуск режима картинка-в-картинке
Не работает разблокировка при открытии Smart Cover на iPad
Что делать, если один из IMEI на iPhone заблокирован
Почему на iPhone не видно открытые вкладки Safari с Mac
Почему iPhone подключается к сети Wi-Fi не с первого раза
Как на Mac смотреть скорость подключения к сети и отслеживать лимит трафика
Как сбросить настройки приложения Почта на iPhone
Проблемы с Lightning-кабелем. Как разобраться, в чем дело?