Чудо технологий
Apr. 1st, 2006 11:33 pmКомрад
norvog порадовал ссылкой на фейс-сканер (или, если не радуют американизмы - лицегляд).
Немного поигравшись с этой штуковиной (внимание! требует регистрации. Бесплатной, впрочем), я установил, что это не распознавание лиц, а гадание на кофейной гуще - результаты подсовывания двух разных фоток из одной серии дали совершенно непересекающиеся множества результатов. И не стал бы я этим заниматься, если б не одно "но" - недавняя новость о появлении некоего чудо-видеокодека для "объектно-ориентированной видеокомпрессии". Принцип работы коего расписывается так: Суть объектно-ориентированной компрессии сводится к выделению на картинке отдельных объектов, например, лица человека. Сжатие изображения этих объектов осуществляется по специальным алгоритмам, отличным от тех, которые применяются к фону (при этом обещаются безумные коэффициенты компрессии типа 15168:1). Новость опубликована 31 марта, так что вроде как не должно быть шуткой.
Суть алгоритма распознавания лиц, насколько я понимаю, так же сводится к "сжатию" - из общего изображения вычленяются характерные элементы, затем выясняется их соотношения между собой (пропорции площадей и т.п.), затем по получившемуся набору чисел производится поиск в базе - изыскиваются схожие наборы.
Прикольно будет, если этот кодек вот с такой вот "точностью" распаковывает видео, что в получающемся видеопотоке лица _вроде_ похожи на то, что там должно было бы быть... :)
Впрочем, в прошлом уже не раз мелькали сообщения о каких-то чудо-кодеках и шайтан-алгоритмах сжатия, только вот где они все?..
Немного поигравшись с этой штуковиной (внимание! требует регистрации. Бесплатной, впрочем), я установил, что это не распознавание лиц, а гадание на кофейной гуще - результаты подсовывания двух разных фоток из одной серии дали совершенно непересекающиеся множества результатов. И не стал бы я этим заниматься, если б не одно "но" - недавняя новость о появлении некоего чудо-видеокодека для "объектно-ориентированной видеокомпрессии". Принцип работы коего расписывается так: Суть объектно-ориентированной компрессии сводится к выделению на картинке отдельных объектов, например, лица человека. Сжатие изображения этих объектов осуществляется по специальным алгоритмам, отличным от тех, которые применяются к фону (при этом обещаются безумные коэффициенты компрессии типа 15168:1). Новость опубликована 31 марта, так что вроде как не должно быть шуткой.
Суть алгоритма распознавания лиц, насколько я понимаю, так же сводится к "сжатию" - из общего изображения вычленяются характерные элементы, затем выясняется их соотношения между собой (пропорции площадей и т.п.), затем по получившемуся набору чисел производится поиск в базе - изыскиваются схожие наборы.
Прикольно будет, если этот кодек вот с такой вот "точностью" распаковывает видео, что в получающемся видеопотоке лица _вроде_ похожи на то, что там должно было бы быть... :)
Впрочем, в прошлом уже не раз мелькали сообщения о каких-то чудо-кодеках и шайтан-алгоритмах сжатия, только вот где они все?..
no subject
Date: 2006-04-02 12:27 am (UTC)Кстати, ты зря так уж пессимистично настроен. Если он будет распознавать лицо как этот вот лицегляд, а потом работать наподобие DejaVu, то получиться может весьма неплохая компрессия. Правда 15168:1 - думаю перебор, но то как DejaVu сжимает меня лично весьма впечатляет. Насколько я понимаю он разделяет текст и фон и соответственно фон сжимает с существенной потерей качества, а текст почти без потерь.
А где лицо даже этот вот лицегляд распознаёт вроде стабильно.
Так, что может чего работоспособное и получится.
no subject
Date: 2006-04-02 12:33 am (UTC)что-то подсказывает мне, что если подходит к задаче прямолинейно, то кодек распухнет до невероятных размеров...
no subject
Date: 2006-04-02 12:56 am (UTC)