본문 바로가기

반응형

연구

(58)
[설치] MPI-IS mesh github 설치 libboost-dev 위치 설정 : /usr/lib/x86_64-linux-gnu https://github.com/MPI-IS/mesh GitHub - MPI-IS/mesh: MPI-IS Mesh Processing Library MPI-IS Mesh Processing Library. Contribute to MPI-IS/mesh development by creating an account on GitHub. github.com 위 깃헙 코드를 사용하기 위해 README 를 따라가다가 나중에 다시 보면 어려워할 부분이 있는거같아 기록하고자 한다. $ BOOST_INCLUDE_DIRS=/path/to/boost/include make all 여기서 /path/to/boost/include 부분은 l..
[개념] Fundamental matrix 와 Essential matrix Fundamental matrix 와 Essential matrix 는 multi-view camera system 에서 나오는 개념이다. Fundamental matrix : Calibration 돼 있는 Camera 들이 있을 때, 3차원 공간상에 있는 점 P를 두 카메라가 바라본다면 위와 같이 표현될 것이다. 이 때 왼쪽 평면에 투영된 Y^u_p 가 오른쪽 평면에 어디로 투영될 지를 결정하는 결정하는것이 fundamental maxtrix 이다. Y^u_p 는 source view 에서 epipolar line 위에 있는 한점으로 투영되는데 이를 유도하는 과정과 수식은 링크에서 확인하자. Essential matrix : Essential matrix 는 Calibration 된 카메라들 사이의 관..
[파이썬] 피클 pickle 파일 읽기, 쓰기 딥러닝 공부를 하며 코드들을 다루다 보면 피클 형식으로 저장되어 있는 데이터를 불러오거나 데이터를 피클 형식으로 저장해야 하는 경우가 더러 있다. 그렇다면 피클 pickle 이란 무엇일까? 텍스트 상태의 데이터가 아닌 파이썬 객체 자체를 파일로 저장하는 것을 말한다. 이 때 원하는 객체 자체를 바이너리로 저장해놓는 것이고 필요할 때 불러오기만 하면 되기 때문에 속도가 빠르다는 장점이 있다. 각설하고 피클 사용법은 아래와 같다. import pickle my_data = ['a','b','c'] ### 피클 파일로 저장할 때 ### with open("data.pickle","wb") as fw: pickle.dump(my_list, fw) ### 피클 파일 불러오기 ### with open("data.p..
[좌표계 개념] 연구에서 사용하는 좌표계개념 정리 Computer vision task를 다루면서 Data loader를 만들다보면 월드좌표계, 카메라좌표계, 이미지좌표계 개념을 잘 알아야 함을 뼈저리게 느낀다. 따라서 나중에 혼동을 방지하기 위해 이 글을 정리한다. GT를 카메라좌표계상에서 정의된 KP라고 하면 모델은 추가정보 없이 이미지만 입력받고서 카메라좌표계상의 KP를 알아낼 수 있을까? 대답은 No. 모델이 받는 input 이미지는 다음과 같이 생성된다. world 좌표계상의 좌표 -> (카메라 외부 파라미터) -> 카메라 좌표계상의 좌표 -> (카메라 내부 파라미터) -> image 좌표계상의 좌표 -> (bbox crop) -> cropped image 좌표계상의 좌표 -> (resize) -> cropped, resized image 좌표..
[error] 파이썬 data loader 시간지연문제 파이썬 data loader 시간지연문제는 사실 data loader안에서 생기는 문제가 아니고 파이썬 threading 문제다. File "test_dataloader.py", line 39, in _debug_h36m() File "/home/kwu/Desktop/chun/code/METRO_REAL/main/../data/Human36M/Human36M.py", line 464, in _debug for i, (inputs, targets, meta_info) in enumerate(train_loader): File "/home/kwu/anaconda3/envs/metro_real/lib/python3.7/site-packages/torch/utils/data/dataloader.py", line..
[명언] 카이스트 윤덕용 교수님의 가르침 - 생각없이 열심히 노력만 하려고 하지 말고 머리를 써라. - 네가 하는 분야에서 세계 최고가 되라. - 연구하는 것을 즐겨라 - 제품이 아닌 작품을 만들듯, 연구 활동 하나하나에 최선을 다하라. 출처 : 『몰입』 - 황농문
[논문 리뷰] End-to-end object detection with transformers 빠르게 이해하기(DETR 리뷰) Contribution 1.Transformer를 object detection에 최초로 적용 2.기존의 object detection 모델들과 달리 direct prediction이 가능하여 hand-crafted process 가 없어도 된다. 배경설명 기존의 object detection 기법들 region proposal 물체가 있을법한 영역에 bounding box를 생성하고 이후 network에서 해당 부분의 image를 분석한다. R-CNN이후 연구들에선 region proposal도 network 로 학습하는 연구를 하고있다. anchor object detection의 고질적인 문제로 1개의 grid에 여러 object가 겹쳐있을 때 해당 grid에서 여러 object를 탐지하기 어렵다는..
[transformer] Multihead self-attention 과 multihead attention비교 요새 비전분야에서도 transformer가 많이 활용되고 있어서 관련 논문들을 읽어보는데 의문인 부분들이 있어서 정리겸 블로그에 글을 써본다. transformer의 encoder는 MHSA(multihead self-attention)만 사용하고, decoder는 MHSA, MHA 둘 다 사용한다. 그럼 여기에서 MHSA과 MHA의 차이가 뭔지 의문이 생긴다. MHSA은 입력정보 주체가 하나다. 이 하나의 정보를 가지고 비교분석을 시행하는게 MHSA의 역할이고 곧 encoder의 역할이다. 예를 들어 CNN을 거치고 나온 feature vector정보가 transformer encoder 에 들어가면 MHSA는 입력받은 feature vector들만 가지고 비교분석을 시행한다. MHA은 입력정보 주체가..

반응형