본문 바로가기

반응형

카테고리

(177)
[논문 정리] Pose Machines: Articulated Pose Estimation via Inference Machines 이전까지는 graphical models에 근간하여 사람의 pose estimator를 만들었으나 카네기멜론에서 제안하는 새로운 방식은 이전의 방식에서 벗어나 새로운 method를 제안한다. Introduction 사람 관절 추정의 어려움, 기존 모델 설명, 이 논문에서 사용하는 모델의 특징 간단 소개 사람의 관절 추정이 어려운 가장 큰 두가지 이유는 다음과 같다. 사람 관절의 자유도가 높다. 거의 20자유도 가까이 된다. 이미지에 찍힌 사람에 대한 변수가 많다.(사람의 자세, 이미지의 상태 등) 기존의 graphical model의 단점은 간단히 말하자면 데이터의 complexity와 tractability of inference의 관계가 trade off 관계라는 것이다. 사람이 다양한 자세를 취하더..
[CPM 논문 정리] Convolutional Pose Machines abstract 요약 belief map, 즉 confidence map에 동작시키는 convolutional networks를 기존의 구조(pose machine)에서 추가하였고, 이로 인해 각 part 좌표를 탐지하는 성능이 좋아졌다고 한다. 또한 기울기 소멸 문제에 대해 설명하는데 중간 지도자의 역할을 하는 natural learning objective function을 제공함으로 써 기울기 소멸문제를 해결했는데 이에 대한 설명이 주를 이룰 것으로 보인다. 정리하기 전에 일단 이해한 내용들 적어놓기 1. 찾기 쉬운 영역을 찾고 그 part가 제공하는 spatial context으로 인해서 찾기 어려운 part를 쉽게 찾을 수 있게된다. 예) 목, 어깨, 머리를 찾으면 ==> 오른쪽 팔꿈치를 찾기 ..
[논문 정리] openpose 이해를 위한 개념 간단 정리 openpose의 전체적인 system architecture 전체 시스템 개요를 보도록 하자. 이미지파일을 VGG망의 input으로 넣는다. 여기서는 stage들어가기 전에 F라고 표현된 것이 VGG망의 일부이다. VGG망을 거치면 이미지 파일에서 features가 강조되어 나오는데 이 output을 2개로 분할하여 stage에 있는 각각의 branch에 input으로 넣는다. 여기서 branch1은 confidence map을 예측하는 망을 의미하고 branch2는 affinity field를 예측하는 망을 의미한다. 각각이 의미하는 바는 아래에서 설명하도록 한다. 각각의 branch를 거쳐서 나온 결과물들은 합쳐서 이전에 만든 features와 함께 다음 stage로 분기되어 들어간다. 이 과정을 ..
[딥러닝 강의 정리] Linear-regression 전체 개요 한눈에 보기 선형회귀 - 개념 가로축 : input, 세로축 : output 파란점 : 주어진 data. 회귀란 주어진 discrete한 데이터들을 한눈에 이해하기 쉽게 그래프로 근사하고자 하는 방법이다. 그런데 어떤 직선으로 회귀시켜야 데이터를 오차없이 가장 잘 근사시키는 건지 알아보자. 선형회귀 시키면 위 그림과 같이 여러개의 직선이 나온다. 이 때 회귀식은 다음과 같다. 선형회귀 - 개념 - error, residual, cost 이 때, 가장 잘 근사한 선형식은 당연히 error가 가장 작을 것이다. residual : 선형회귀식과 data간의 차이를 말한다. 가장 왼쪽 점의 좌표를 x1,y1이라고 하자. 이 때 회귀식을 H(x) = wx + b 라고 하면, 회귀식이 x1일때 예측한 값..
[char형 배열과 string] 문자배열과 문자열 의 차이 자료형 string 은 기본 자료형이 아니라 객체이다. char형 배열은 기본 자료형이다. string은 객체이기 때문에 c언어에 없다. c++부터 제공하는 클래스이다. 차이 string은 마지막에 \0을 담지 않는다. 즉, string은 문자열의 마지막을 null문자로 구분하는것이 아니다. char형 배열은 마지막에 \0을 담는다. 즉, char형 배열은 \0로 문자열의 마지막을 구분한다. string은 애초에 '\0'을 담지 못한다. 그러나 char형 배열은 '\0'을 사용자가 임의로 넣을 수 있다. 따라서 char c[] = "app\0le" 이라고 선언후 출력하면 app까지만 출력된다. 사용자가 임의로 넣은 \0을 보고서 문자열의 마지막이라고 판단하기 때문이다. string과 char[]를 구분해..
[논문정리] Efficient Online Multi-Person 2D Pose Tracking withRecurrent Spatio-Temporal Affinity Fields 본 논문은 2d카메라를 통해 사람의 skeleton을 따는, 즉 3d pose와 motion을 잡아내는법에 대한 논문이다. online tracking 에서 충족되어야 하는 3가지 사항이 있다. occlusion, proximity, contact 문제를 극복해야 한다. 즉, 사람간의 근접, 접촉문제와 사람으로 인한 관절 가려짐 현상에 대한 극복을 말한다. 사람 수가 늘어도 런타임에 문제가 안생기고 실시간성이 보장되어야 한다. 즉, 연산량이 적어야한다는 뜻 카메라의 큰 모션, frame간의 동작흐림효과에 대해서도 강한 성능을 보여야 한다. TAF, PAF개념 이 논문은 TAF(Temporal Affinity Fields)방식를 제안하는데 TAF는 PAF방식에 근간한다. PAF란 Part affinity ..
[시스템프로그래밍 강의정리] files and directories - 2 file, directory안에서 쓸 수 있는 명령어들을 배웠다. 명령어 모음 : access() umask() chmod() chown() link() unlink() readlink() remove() rename() 위 명령어들에 대해서 간단히 설명하시오. 설명할 수 없으면 공부해야합니다. 명령어 모음 : access() : 해당 접근 권한이 있는지 확인 umask() : 해당 권한을 뺀다 chmod() : 접근 권한바꾸기 chown() : 파일에 대한 소유주를 바꾼다 link() : 하드링크, 소프트링크 연결에 대한 명령어 unlink() : 링크 제거 (file,dir 제거까지 가능) readlink() : 링크의 path를 가져오는 명령어 remove() : 파일 제거 rename() : 파일..
[char*, char[], const char* ] 문자열 상수, 문자열 변수 이해 char* s1 = "abc"; char s2[] = "abc"; 위의 s1,s2는 어떻게 다를까? 언뜻 보기에 다르지만 완전히 다르다. 결론적으로 말하자면 s1은 문자열 상수, s2는 문자열 변수이다. 컴파일 하면서 s1이 가리킬 "abc"는 정적영역에서 생성되고 정적영역에서의 "abc"의 시작주소를 s1에 넣는다. s2는 힙영역에 "abc"가 생성되고 그 시작주소를 s2에 넣는다. s2가 우리가 익히 알고있는 변수, 혹은 포인터 방식이다. s1은 정적영역에 생성되었기 때문에 s1의 값을 바꾸지 못한다. 즉, 상수가 된것이다. 그러나 s1이 가리키는 대상은 바꿀 수 있다. 왜냐?? 근본적으로 s1은 포인터이기 때문이다. 포인터라서 가리키는 대상은 바꿀 수 있지만, "abc"는 정적영역에 있기때문에 바꾸..

반응형