PSI-5796: Processamento e Análise de Imagens e Vídeos (2020)

Aulas: Terças-feiras, 13:00-16:00, na sala GD-05

Apostilas

Software



Prova
EP
18/02 aula 01


25/02 Carnaval - sem aula

03/03 aula 02

10/03 aula 03


17/03 aula 04


24/03 aula 05


31/03 aula 06 P1

07/04 Semana Santa - sem aula


14/04 aula 07

21/04 Tiradentes - sem aula

28/04 aula 08


05/05 aula 09


12/05 aula 10


19/05 aula 11
P2


Nota: Quem estiver pesquisando um tema interessante relacionado com esta disciplina, pode contribuir dando um seminário (sem valer nota). Envie um email para mim (hae@lps.usp.br) com o resumo do seminário.


Critério de nota 2019: 

Exercícios-programas: MEP=(EP1+EP2)/2
Provas: MP=(P1+P2)/2
PSub: Somente em caráter excepcional para quem justificar a falta numa das duas provas (doença, luto, etc). No dia a combinar comigo. Quem precisar fazer PSub, envie um email para mim, dizendo qual das duas provas perdeu (ou vai perder) com a justificativa.
Média final: MF=(MEP+MP)/2.

Nota A: 8<=MF<=10
Nota B: 6<=MF<8
Nota C: 4<=MF<6
Nota R: MF<4
Planilha de notas


Aulas planejadas


Aula
Matéria planejada
Matéria dada
Apostilas
1

Apresentação sobre deep learning.
Conceitos básicos.
OpenCV/Cekeikon/C++. Tensorflow/Keras/OpenCV/Python.
Acesso aos pixels.
Modelos de cores.
Brilho/contraste.
Limiarização.
Otsu.
Histograma.

primeira_aula
basico
cekeikon_opencv
limiar
2

Filtros "restritos a janela": mediana, média móvel, filtros lineares.
Gradiente, Sobel, Roberts, Scharr.
Convolução. Correlação. Laplaciano. Convolução através de FFT.
Template matching simplificado. Normalized cross correlation. Template matching.

ltros
convolucao
tmatch
tmatch-simp
3
Reamostragem e interpolação (vizinho mais próximo, bilinear, bicúbica, sinc).
Coordenadas homogêneas, transformada afim, transformada perspectiva.

reamost
transformacao
4
Componente conexo. Fila, pilha e recursão.
Crescimento de semente.
Menor caminho.
Palete. Pseudo-cor.
Representação de imagens (le, imp).
Processamento de vídeo.
Captura de webcam

compcon
palette
video

5
Morfologia matemática binária.
Morfologia matemática em níveis de cinzas.

morfmatb
morfmatg
6

Aprendizagem de máquina
Aprendizagem de operador: ponta de reta, aresta, letra Aa.
vizinho mais próximo [flann e força bruta].
Árvore de decisão, aprendizagem Bayes, Adaboost.
Ganho de informação, features úteis e inúteis.
Não-supervisonada: k-means, median cut,

aprendizagem

7

Aprendizagem de máquina avançada.
Detecção de rostos.
Histograma de gradiente orientado (HOG). Detecção de pessoas.
MNIST usando métodos não-convolucionais
Implementação de rede neural "do zero"


mle_avancada
redeneural
integral

8

Instalação de Python/Numpy/OpenCV/Tensorflow
Overview sobre deep learning
Redes neurais.
Rede neural convolucional.
Funções de ativação, estruturas de rede neural profunda, algoritmos de otimização.
MNIST usando rede neural convolucional

mle_avancada
convolutional
convolutional-keras
9

Elipse-retângulo
Identificação pelo rosto
Identificar rosto masculino/feminino
Identificar rosto sorridente/neutro
CIFAR-10

convolutional
convolutional-keras
Cifar
10
Aumento de resolução por aprendizagem de máquina
Colorização
U-net

convolutional-keras
11
"Data augmentation" em aprendizagem.
Arquiteturas avançadas de rede convolucional: VGG, ResNet e Inception.
Transfer learning.
Localização e detecção de objetos. Yolo.

cifar-reduzido
Outros
Transformada de Hough.
Hough para círculos.
Hough usando gradiente.    
Hough generalizado.

Hough
Outros
Espaço de escala.
Diferença de gaussianas.
Detecção de blobs (keypoints).
Difusão anisotrópica
SIFT (parte inicial)

espescala
Outros
Medidas de distorção de imagens (MAE, RMSE, PSNR, SSIM, CSSIM).
SURF.
Morfologia matemática binária.
Morfologia matemática em níveis de cinza.
Watershed/MSER

Detecção de arestas de Canny.
Detecção de cantos de Harris e SUSAN.
Fluxo ótico.
Textura.
Tomografia: filtered backprojection e ART.
Marca d´água.
data hiding
robusta (spread spectrum, qim)
autenticação
Noções sobre segmentação de imagens,
Minimização de variação total
fMRI.
Filtros nebulosos.
Saco de palavras.
Reconhecimento de objetos.
HighGui do OpenCV
Processamento paralelo: OpenMP e thread do C++
FLTK




Exercícios-programas 2019

Exercícios-programas 2018

Exercícios-programas 2017

Exercícios-programas 2016

Exercícios-programas 2015

Exercícios-programas 2014

Exercícios-programas 2013

Exercícios-programas 2012

Exercícios-programas 2011

Exercícios-programas 2010

Exercícios-programas 2009

Exercícios-programas 2008

Exercícios-programas 2007

Exercícios-programas 2006
Exercícios-programas 2005