재미있는 연구를 발견했는데...
Learning 3D Models from a Single Still Image

어떤 정보가 주어졌을때 그것으로부터 입체정보를 알아내는 stereo-from-X 는 컴퓨터 비젼의 고전적 문제인데,
이 연구에서는 사진 1장만 가지고서 입체 정보를 어떻게 알아낼 수 있느냐 하는 문제를 다루고 있다.

사람은 두 눈으로 보이는 영상이 살짝 다르다는 것을 이용해서 입체정보를 알아낸다는 것이
입체 인식에 대한 인지과학의 전통적인 핵심 결과 중 하나였고,
그러한 사실에 착안하여 두 장 이상의 영상에서 입체 정보를 알아내는 것이 전통적인 방식...

하지만, 인간은 눈 하나만 뜨고서도 대략적인 입체정보를 판단할 수 있으니,
즉, 무엇인지 모르겠지만 어떤 인지 과정을 거쳐 1장의 영상에서도 입체정보를 찾아낸다는 것.

이것에 착안하여 머신러닝(machine learning)을 문제에 적용하려 시도한 것이 이 연구.

아이디어는 간단하지만, 그 아이디어를 막상 실구현하는 것은 그리 쉬운 것은 아니다.
예를 들어, 그런 알고리즘을 쉽게 속일 수 있는 경우는 호수나 거울 등이 있어 반사가 있는 경우.

1장의 영상에서만 입체영상을 뽑아내는 것이니 100%에 가까운 성공률을 기대하는 것은 애초에 무리이고,
논문에 의하면 내 예상보다 괜챦은 성능이 나오는 듯 하다.

예를 들면, 이런 정도...



알고리즘에 대한 설명은 구글 테크 톡 시리즈에 있고...



더 많은 예제와 자세한 정보는 연구팀의 홈페이지로...


Posted by Rainyvale
,


공직선거법 개정 촉구 상단 좌측