kincajou | Чудо технологий

Комрад

norvog порадовал ссылкой на фейс-сканер (или, если не радуют американизмы - лицегляд).
Немного поигравшись с этой штуковиной (внимание! требует регистрации. Бесплатной, впрочем), я установил, что это не распознавание лиц, а гадание на кофейной гуще - результаты подсовывания двух разных фоток из одной серии дали совершенно непересекающиеся множества результатов. И не стал бы я этим заниматься, если б не одно "но" - недавняя новость о появлении некоего чудо-видеокодека для "объектно-ориентированной видеокомпрессии". Принцип работы коего расписывается так: Суть объектно-ориентированной компрессии сводится к выделению на картинке отдельных объектов, например, лица человека. Сжатие изображения этих объектов осуществляется по специальным алгоритмам, отличным от тех, которые применяются к фону (при этом обещаются безумные коэффициенты компрессии типа 15168:1). Новость опубликована 31 марта, так что вроде как не должно быть шуткой.

Суть алгоритма распознавания лиц, насколько я понимаю, так же сводится к "сжатию" - из общего изображения вычленяются характерные элементы, затем выясняется их соотношения между собой (пропорции площадей и т.п.), затем по получившемуся набору чисел производится поиск в базе - изыскиваются схожие наборы.

Прикольно будет, если этот кодек вот с такой вот "точностью" распаковывает видео, что в получающемся видеопотоке лица _вроде_ похожи на то, что там должно было бы быть... :)

Впрочем, в прошлом уже не раз мелькали сообщения о каких-то чудо-кодеках и шайтан-алгоритмах сжатия, только вот где они все?..

Threaded | Top-Level Comments Only

From:

norvog.livejournal.com

Лицегляд - это сильно :))
Кстати, ты зря так уж пессимистично настроен. Если он будет распознавать лицо как этот вот лицегляд, а потом работать наподобие DejaVu, то получиться может весьма неплохая компрессия. Правда 15168:1 - думаю перебор, но то как DejaVu сжимает меня лично весьма впечатляет. Насколько я понимаю он разделяет текст и фон и соответственно фон сжимает с существенной потерей качества, а текст почти без потерь.
А где лицо даже этот вот лицегляд распознаёт вроде стабильно.
Так, что может чего работоспособное и получится.

kincajou.livejournal.com

фигня в том, какой алгоритм для каких объектов выбирать
что-то подсказывает мне, что если подходит к задаче прямолинейно, то кодек распухнет до невероятных размеров...

Ну из очевидного придумать как фон выделить положим относительно легко. Далее выделять движущиеся объекты и сжимать их с лучшим качеством, а на статичных экономить. Плюс к этом должны же они были что-то новое придумать. Но вообще говоря 15168:1 - это как-то больно круто всё же. 15 мегов сжать в один килобайт... Мда. Занятно было бы посмотреть. Тот же DejaVu стабильно жмёт текст 60:1. Так, что это они что-то революционное придумать должны были.

S	M	T	W	T	F	S
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

No Xians Here

Уничтожить всех уродов

Чудо технологий

Чудо технологий

no subject

no subject

no subject

Profile

December 2016

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags