본문 바로가기

수업 내용 정리/CS231n

Lecture 1 | Introduction to Convolutional Neural Network for Visual Recognition

What's computer vision?

최근 카메라 기술의 발달과 이것저것 존나게 발달해서 시각 데이터가 개많이 나오고 있다. 이로 인해 cv 업계도 횡재를 맞게 된다. 왜냐하면 학습을 시키고 검증할라면 데이터가 겁나게 많이 필요하기 때문이다. 어쨌든 이러한 데이터를 분석해서 컴퓨터가 사진을 이해하는 게 컴퓨터 비전이다.

First vision

5억 4천만 년 전, 종이 증폭되는 시기에 눈도 같이 생겨났다. 시각이 생기니까 먹이도 능동적으로 찾을 수 있고 위험으로부터 자신을 지킬 수 도 있었다. 

History of computer vision

1950s
고양이 뇌에 전극을 꽂아 시각적 메커니즘을 알려고 했다.그래서 결론이 뭐였냐면
"시각 처리는 edges와 같은 단순한 구조로 시작되어 점점 복잡한 요소들을 처리하고, 궁극적으로 실제 시각적 input을 인지할 수 있게된다."라고 한다.

1970s
단순한 모양이나 기하학적 구성을 통해 복잡한 객체를 단순화시키는 방법을 제안했다. 구조분석에 초점을 다들 맞추었던 것이다.

2000s
기계학습, SVM, 특징기반 객체인식 알고리즘 등등이 발전함. 슬슬 데이터 셋들이 폭등하기 시작함
ImageNet: 가장 큰 데이터셋으로 overfitting을 방지하고 일반화 능력을 키워 이 세상 모든 객체들을 인식할 준비를 함 그러다가 CNN의 발달로 오류가 확 줄어들게 됨

느낀 점

fei fei 교수님이 강의하시는 명강의 ㄷㄷ
컴퓨터 비전의 역사를 설명해주신다. 요즘 이분야에 대한 호기심이 생기다가고 때려치고 싶은 마음이 들곤 하였는데 잘생긴 연구생분이 컴퓨터 비전 뽕을 거하게 넣어 주신다. 지금 배우는 것들은 전부 최신 내용이니 신나지 않는가 ? 라고 하신다. 5년전 강의인데 그 당시에는 컴퓨터비전이 이제 막뜰때였나 보다. 뭐 그러고도 5년 밖에 안지났으니 다른 분야에 비해선 한참 최신인 것 같기도 하다.  최신인 만큼 영어의 필요성이 부각되어 슬프다 ㅠㅠ.
컴퓨터 비전은 CNN 알고리즘의 출시로 급격히 발달했다고 한다. 근데 아직도 CNN이 중요한 알고리즘인 것을 보면 진짜 최신 기술인 것 같기도 하다. 마지막에 이러한 기술을 가지고 어디에 활용하고 싶으시냐 물어서 간단하게 생각을 해보았다. 근데 아참.. 난 지금 기말 시험기간이다. 공부하기 싫어서 아주 주접을 싸고 있다. 근데 뭐 성적이 뭐가 중요하겠나 성적 좀 망친다고 인생안망한다. 오히려 좋은 강의 듣고 공부하는게 좋을 수 도 있다. 자기 합리화 미쳤고;; 쨌든 생각을 해보았는데 일단 대표적으로 자율주행자동차가 있다. 내 꿈은 자동차들이 존나게 똑똑해져서 막히는 도로가 없는 것이다. 모든 도로가 물흐르듯이 간다면 졸라 좋을 것 같다. 그리고 의료 영상에 도입하면 참 좋을 것 같다. x-ray영상을 분석하고 더 나아가 직접 판단하고 수술까지 진행한다면 졸라 획기적일 것이다. 또 예전 영화중에 마이너리티 리포트라는 영화가 있는데 사람이 손으로 화면을 조종한다 지금 생각해보면  AR기술과 컴퓨터비전 기술이 합쳐진거 같은데 이걸 내가 구현한다?? 정말 좆되는 일이다. 결론은 이 분야에서 젤 유명한 강의라니 방학 때 포기하지 말고 다 들어서 머리에 처 넣고 싶다.^^

'수업 내용 정리 > CS231n' 카테고리의 다른 글

Lecture 3 | Loss Functions and Optimization  (0) 2023.07.09
Lecture 2 | Image Classification  (0) 2023.06.13