Blog

Blog

30 de abr. de 2012

Câmera descreve as imagens em vez de tirar fotos


A Câmera Descritiva imprime textos sobre a cena fotografada usando um um pequeno truque para realizar a mágica.

Usando uma webcam, uma placa BeagleBone (plataforma para fazer protótipos), e uma impressora térmica A Câmera Descritiva se liga a internet através de um cabo. Assim, ao bater ser operada para bater uma foto ao invés de você obter a imagem a câmera imprime um papelzinho com a descrição da foto após alguns minutos.

A "inteligência" da câmera não é artificial. Através da ligação com a internet o arquivo com a imagem é enviado para que pessoas realmente analisem a fotografia e envie a descrição de volta, 3 a 6 minutos depois, para a máquina que finalmente a imprime.

O trabalho é realizado por funcionários da Amazon Mechanical Turk (MTurk), que se trata de um serviço contratado por empresas no qual seres humanos fazem as tarefas que os computadores não são capazes de fazer (ou que seria custoso demais desenvolver a tecnologia para realizá-la).

A mídia até que comprou a ideia e celebra a novidade como uma invenção que pode ser uma espécie de marco divisório que unirá o crowdsourcing e os gadgets.

Isso não é muito diferente da ideia de serviços inteligentes como o Siri (embora esse, especificamente, não seja o caso) ou a voz pelo GPS do carro de Kurt no filme Quero Matar meu Chefe (Horrible Bosses) utilizar mão-de-obra barata no oriente para realizar pesquisas em serviços de buscas como o Google ou Bing e manualmente realizar filtros devolvendo resultados estruturados que tenham entendido os comandos através da fala natural.

Isso não é muito diferente da famosa máquina de jogar xadrez, "O Turco", que na realidade escondia um anão que era praticamente um mestre imbatível do xadrez (a história é a inspiração do nome do serviço da Amazon que a Câmera Descritiva utiliza) e que iludiu a Europa no século XVIII (Kasparov suspeitou de fraude semelhante ao ser derrotado pelo Deep Blue em 1997).

A diferença é que Câmera Descritiva não esconde o seu anão de ninguém e ainda assim é celebrada como uma grande ideia que só poderia sair das mentes brilhantes daqueles capazes de enxergar o óbvio.


A seguir, algumas amostras do tipo de descrição emitida pela câmera (retiradas do site do inventor, Matt Richardson).

Esta é uma imagem desbotada de um edifício em ruínas. Parece estar caindo e necessitando de reparos.
Parece um armário de copos feio e velho, que tem placas com nomes e uma lâmpada de estudo ao lado.
Canto de um quarto com piso de madeira com uma caixa de ferramentas, uma bicicleta, uma pilha de livros, uma caixa encostada na parede, uma porta aberta com uma bolsa pendurada na maçaneta e uma porta dupla fechada com cabos pendurados

[Via BBA]