Ricardo:
Estudo percepção humana há mais ou menos 25 anos (um pouco mais). Sou mestre em arquitetura pela UFRJ com trabalho a respeito disso. Um dos maiores enganos que se pode cometer é tentar entender o olho a partir da máquina fotográfica, pois o olho não é um órgão passivo como a câmera, mas essencialmente ativo.
Essa atividade é tal, e sua ação perceptiva é de tal modo significada, que toda comparação com câmeras mais obscurece o entendimento que o amplia.
A questão é a seguinte: uma câmera captura um determinado campo, desde que esteja voltado para ele. Haverá coisas em foco, outras não, mas tudo para o que estiver apontada a câmera sairá na foto em posições relativamente "coerentes", digamos assim. As lentes são projetadas para simular o melhor possível não exatamente a visão humana, mas a perspectiva cônica. Porque? Porque a perspectiva cônica é matematicamente e conceitualmente perfeita, enquanto a visão humana tem enormes aberrações esféricas. Embora convencionalmente achemos crível o espaço representado pelos pintores renascentistas, que nada mais é do que o espaço da perspectiva cônica, nossa visão não funciona assim. Ela funciona com uma lente de enorme aberração, foco curto e nitidez somente numa parte mínima.
O que acontece é que a representação do espaço tornou-se, a partir do Renascimento, uma representação onde o "verdadeiro espaço" passou a ser um espaço matemático, e esse espaço é euclidiano/cartesiano, isto é, isotrópico.
O que é tal espaço isotrópico? Para nós pel parece muito natural, mas é meramente uma convenção cultural sem correspondência no real. O espaço isotrópico é uma grade tridimensional cartesiana. Só esse espaço pode ser vertido para a perspectiva cônica, que pode ser definida como "espaço cartesiano ao qual se aplica um ponto de fuga". As lentes são feitas para capturar essa grade sem deformá-la. Isso é uma lente de boa qualidade: não aquela que captura o mundo como nosso olhar, mas aquela que o captura de acordo com a matemática euclidiana.
Porém o olho não funciona assim. O olho funciona integrando diversos padrões reconhecidos num mesmo quadro. Se usarmos um eye-tracker para acompanhar um olho quando observa uma construção, por exemplo, veremos que ele realiza uma rotina escrutinatória induzida pela própria forma que está sendo examinada. Se dá certo, ele "reconhece" a coisa. Isso é muito rápido, e ele escrutina todo o quadro, e ao fazê-lo a pupila se abre e se fecha, os múlculos o achatam ou o tornam menos achatado variando o foco, etc, e o "quadro" formado não é formado de uma só visada, como na câmera, mas de uma integração mental de uma infinidade de instantes, de uma enorme quantidade de atos escrutinatórios.
O Olhar é basicamente interativo, ou, no dizer do Edgar Morim, "complexo". Isso é tão defindior do olhar que compará-lo à câmera somente elide sua complexidade.
Na câmera, o sensor é passivo. Toda a luz que nele incide é registrada. No olho o sensor é ativo. Ele é tecido neurológico que se ativa ou se inibe independentemente, ou com certa independência, da imagem que se formaria. Mais que isso, o sensor e os músculos que comandam o foco e o direcionamento interegem todo o tempo "procurando significado". Olhar não é uma atividade do olho. É uma atividade mental que usa o olho.
Bem, essa conversa poderia continuar indefinidamente, mas só para você ver que ainda há muito por dizer, pegue tudo o já dito, toda essa complexidade, e multiplique por dois, pois já não é mais um olho só funcionando, mas a integração de duas informações, com paralaxe, convergência, etc.
Deu para entender?