kincajou: (Default)
[personal profile] kincajou
Комрад [livejournal.com profile] norvog порадовал ссылкой на фейс-сканер (или, если не радуют американизмы - лицегляд).
Немного поигравшись с этой штуковиной (внимание! требует регистрации. Бесплатной, впрочем), я установил, что это не распознавание лиц, а гадание на кофейной гуще - результаты подсовывания двух разных фоток из одной серии дали совершенно непересекающиеся множества результатов. И не стал бы я этим заниматься, если б не одно "но" - недавняя новость о появлении некоего чудо-видеокодека для "объектно-ориентированной видеокомпрессии". Принцип работы коего расписывается так: Суть объектно-ориентированной компрессии сводится к выделению на картинке отдельных объектов, например, лица человека. Сжатие изображения этих объектов осуществляется по специальным алгоритмам, отличным от тех, которые применяются к фону (при этом обещаются безумные коэффициенты компрессии типа 15168:1). Новость опубликована 31 марта, так что вроде как не должно быть шуткой.

Суть алгоритма распознавания лиц, насколько я понимаю, так же сводится к "сжатию" - из общего изображения вычленяются характерные элементы, затем выясняется их соотношения между собой (пропорции площадей и т.п.), затем по получившемуся набору чисел производится поиск в базе - изыскиваются схожие наборы.

Прикольно будет, если этот кодек вот с такой вот "точностью" распаковывает видео, что в получающемся видеопотоке лица _вроде_ похожи на то, что там должно было бы быть... :)

Впрочем, в прошлом уже не раз мелькали сообщения о каких-то чудо-кодеках и шайтан-алгоритмах сжатия, только вот где они все?..

Date: 2006-04-02 12:27 am (UTC)
From: [identity profile] norvog.livejournal.com
Лицегляд - это сильно :))
Кстати, ты зря так уж пессимистично настроен. Если он будет распознавать лицо как этот вот лицегляд, а потом работать наподобие DejaVu, то получиться может весьма неплохая компрессия. Правда 15168:1 - думаю перебор, но то как DejaVu сжимает меня лично весьма впечатляет. Насколько я понимаю он разделяет текст и фон и соответственно фон сжимает с существенной потерей качества, а текст почти без потерь.
А где лицо даже этот вот лицегляд распознаёт вроде стабильно.
Так, что может чего работоспособное и получится.

Date: 2006-04-02 12:33 am (UTC)
From: [identity profile] kincajou.livejournal.com
фигня в том, какой алгоритм для каких объектов выбирать
что-то подсказывает мне, что если подходит к задаче прямолинейно, то кодек распухнет до невероятных размеров...

Date: 2006-04-02 12:56 am (UTC)
From: [identity profile] norvog.livejournal.com
Ну из очевидного придумать как фон выделить положим относительно легко. Далее выделять движущиеся объекты и сжимать их с лучшим качеством, а на статичных экономить. Плюс к этом должны же они были что-то новое придумать. Но вообще говоря 15168:1 - это как-то больно круто всё же. 15 мегов сжать в один килобайт... Мда. Занятно было бы посмотреть. Тот же DejaVu стабильно жмёт текст 60:1. Так, что это они что-то революционное придумать должны были.

December 2016

S M T W T F S
    123
45678910
11121314151617
18192021222324
25 262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Apr. 10th, 2026 02:57 pm
Powered by Dreamwidth Studios