НОУ ИНТУИТ | Разработка мультимедийных приложений с использованием библиотек OpenCV и IPP. Лекция 4: Отслеживание движения и алгоритмы сопровождения ключевых точек

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 02.09.2013 | Доступ: свободный | Студентов: 430 / 54 | Длительность: 19:27:00

Тема: Программирование

Специальности: Программист, Системный архитектор

Теги: IPP, Visual Studio, c++, intel, OpenCV

|

Вам нравится? Нравится 15 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

1.4. Параметрические модели движения

Многие прикладные задачи, такие, как склеивание изображений в панораму, стабилизация видео, требуют построения более сложных моделей движения, т.к. движение не описывается только линейным сдвигом. Поэтому рассматриваются пространственные поля смещений, и выполняется построение параметрических моделей движения (parametric motion, [5, гл. 8.2]). В параметрических моделях вместо постоянного вектора смещения [u,v]^T рассматривается параметризованное поле смещений x'(x,y;p) , где p-вектор параметров. Приведем некоторые примеры параметризованных моделей:

Линейный сдвиг (4.29).
$x'(x,y;p)=\begin{bmatrix} E & p \\ {0^T} & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ 1 \end{bmatrix},$ ( 4.29)
где $p=\begin{bmatrix} {p_1} \\ {p_2} \end{bmatrix}$ – вектор сдвига.
Поворот со сдвигом (4.30).
$x'(x,y;p)=\begin{bmatrix} {cos\,\phi} & {-sin\,\phi} & {p_1} \\ {sin\,\phi} & {cos\,\phi} & {p_2} \\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} x \\ y \\ 1 \end{bmatrix},$ ( 4.30)
где $R=\begin{bmatrix} {cos\,\phi} & {-sin\,\phi} \\ {sin\,\phi} & {cos\,\phi} \end{bmatrix}$ – ортонормированная матрица поворота, т.е. и $det\,R=1$ , $p=(p_1,p_2,\phi)$ – набор параметров модели движения.
Преобразование подобия (4.31).
$x'(x,y;p)=\begin{bmatrix} a & -b & {p_1} \\ b & a & {p_2} \\ 0 & 0 & 1 \end{bmatrix}\begin{bmatrix} x \\ y \\ 1 \end{bmatrix},$ ( 4.31)
где $sR=\begin{bmatrix} a & -b \\ b & a \end{bmatrix}$ – матрица поворота, умноженная на коэффициент масштабирования $s,\,p=(p_1,p_2,a,b)$ – набор параметров модели движения.
Аффинное преобразование (4.32).
$x'(x,y;p)=\begin{bmatrix} a_{00} & a_{01} & a_{02} \\ a_{10} & a_{11} & a_{12} \end{bmatrix}\begin{bmatrix} x \\ y \\ 1 \end{bmatrix}$ ( 4.32)
Перспективная проекция или гомография (4.33).
$x'(x,y;p)=\begin{bmatrix} h_{11} & h_{12} & h_{13} \\ h_{21} & h_{22} & h_{23} \\ h_{31} & h_{32} & h_{33} \end{bmatrix}\begin{bmatrix} x \\ y \\ 1 \end{bmatrix}=H\overline{x}$ ( 4.33)

Аналогично процедуре уточнения направления, описанной в разделе 1.3, можно выполнить определение направления движения для любой параметрической модели (4.35), расписав квадратичную функцию ошибки (4.34) с помощью разложения в ряд Тейлора по вектору параметров и выполнив ее минимизацию.

$E(p+\Delta p)=$

$\sum_i {(I_k(x'(x_i,y_i;p+\Delta p))-I_{k-1}(x_i,y_i))^2}\Approx$

( 4.34)

$\sum_i {(I_k(x'_i) +I_k(x'_i)\Delta p-I_{k-1}(x_i,y_i))^2}=$

$\sum_i {(J_k(x'_i)\Delta p+e_i)^2} \rightarrow min_{\Delta p},$

( 4.35)

$e_i=I_k(x'_i)-I_{k-1}(x_i,y_i),$ $J_k(x'_i)=\frac {\delta I_k} {\delta p}=\nabla I_k(x'_i)\frac {\delta x'_i} {\delta p}\rvert_{(x_i,y_i)}.$

1.5. Многоуровневое движение

Во многих случаях визуальное движение вызвано смещением небольшого количества объектов, находящихся на разной глубине изображения [5]. Поэтому движение пикселей можно описать более эффективно, если сгруппировать их в слои [14], и отслеживать многоуровневое движение (layered motion, [5, гл. 8.5]) построенных слоев, например, с помощью параметрических моделей [15].

Последовательно рассмотрим основные вопросы, которые возникают в процессе определения многоуровневого движения, и схемы их решения, предложенные в одной из первых работ по данной тематике [15].

1. Как представить слой? Слой определяется набором из трех карт (матриц):

матрица интенсивности слоя (в компьютерной графике текстурная карта);
$\alpha$ карта, которая определяет прозрачность слоя в каждом точке изображения;
карта скоростей описывает изменение положения точек с течением времени.

Ниже (рис.4.3) показан пример представления кадров в виде набора слоев. Изображения в строке (а) соответствуют фоновому слою, в строке (b) – слою, содержащему объект (рука), в (с) – последовательность изображений, восстановленная на основании выделенных слоев.

Рис. 4.3. Пример представления изображения в виде набора слоев [15]

Предположим, что E_0(x,y) – матрица интенсивности фонового слоя, E_1(x,y) – слоя, содержащего объект, $\alpha_1(x,y)$ – $\alpha$ -карта слоя . Поскольку слои перекрываются, то для представленного примера восстановить можно исходное изображение согласно (4.36).

$I_1(x,y)=E_0(x,y)(1-\alpha_1(x,y))+E_1(x,y)\alpha_1(x,y)$

( 4.36)

Отметим, что данную процедуру можно распространить на случай большего количества слоев (4.37).

$I_k(x,y)=I_{k-1}(x,y)(1-\alpha_k(x,y))+E_k(x,y)\alpha_k(x,y)$

( 4.37)

2. Как разбить множество пикселей на слои и определить движение каждого слоя? Процедура разбиения на слои состоит из нескольких шагов:

Оценивание движения с использованием оптического потока и аффинной модели для набора неперекрывающихся блоков (рис.4.4, а), полученных в результате разбиения исходного изображения. Данная операция выполняется независимо для каждого кадра из подмножества изображений.
Кластеризация полученных оценок с помощью метода k-средних (рис.4.4, b). Кластеризация также осуществляется независимо для каждого изображения. Каждый кластер определяет сегмент, отвечающий некоторому слою изображения.
Применение медианной фильтрации для получения смешанных слоев, устойчивых к незначительным изменениям интенсивности, а также для выявления перекрытий между слоями (рис.4.4, c).

Рис. 4.4. Пример выделения слоев [14]

Впоследствии подобная схема была распространена на случай стерео. В более поздних работах, связанных с определением многослойного движения, рассмотренный подход модифицируется в части выделения слоев, например, для цветных изображений выполняется привычная сегментация и выполняется оценивание движения каждого сегмента в отдельности.

Дальше >>

Авторизоваться

Разработка мультимедийных приложений с использованием библиотек OpenCV и IPP

Лекция 4: Отслеживание движения и алгоритмы сопровождения ключевых точек

1.4. Параметрические модели движения

1.5. Многоуровневое движение

Вопросы и ответы