728x90

[Submitted on 10 Jun 2014]

Generative Adversarial Networks

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio

 

 

 

0. 초록

- 본 논문에서는 적대적인 처리 과정을 거치는 생성 모델들을 구하는 새로운 프레임워크를 소개합니다.

- 여기서 두 모델을 동시에 학습하는데, 생성 모델 G는 데이터 분포를 캡처하고, 판별 모델 D는 실제 훈련 데이터셋으로부터 얻은 샘플인지 G로부터 얻은 샘플인지에 대한 확률을 추정합니다.

- 생성 모델 G의 훈련 과정은 D가 실수할 확률을 최대화 시킵니다.

- 이 프레임워크는 두 선수의 최소 최대 게임이라 할수 있으며, G, D는 정답을 가지고 있는 함수가 되겠습니다. G는 훈련 데이터셋의 형태로 분포를 복원시켜야 하며, D는 1/2에 가까워져야 합니다. 

- G, D를 다층 퍼셉트론으로 구현시에 전체 시스템은 역전파 과정을 통해서 학습시킬수 있으며, 마르코브 체인이나 학습이나 샘플 생성하는 동안 근사 추론 과정을 펼칠 필요가 없겠습니다.

- 실험 결과를 보면 이 프레임 워크의 잠재력을 생성된 샘플의 질적 평가와 양적 평가를 통해 보여주고 있습니다.

 

 

 

 

 

300x250
728x90

arxiv.org/abs/1604.03540

[Submitted on 12 Apr 2016]

Training Region-based Object Detectors with Online Hard Example Mining

 

0. 초록

0.1 현황

- 물체 검출 분야에서 영역 기반 합성곱 신경망을 이용하여 많은 진보가 있어왔다. 하지만 이런 방법들의 학습과정은 여전히 많이 휴리스틱/경험적이며, 많은 조정해야할 하이퍼파라미터들을 가지고 있다.

 

0.2 특징

- 그래서 영역 기반 합성곱 신경망 검출기를 효율적으로 학습하기 위한 online hard example mining OHEM 알고리즘을 소개 한다.

- 이 방법은 검출 데이터셋은 대다수의 쉬운 예시와 소수의 어려운 예시들을 가지고 있다. 여기서 어려운 예시들만 자동적으로 선택하여 학습을 더 효과적이고 효율적으로 만들겠다.

- OHEM은 단순하고, 직관적인 알고리즘인데 흔하게 사용되는 경험적인 것들과 하이퍼 파미터들을 제거한다. 하지만 더 중요한것은 이렇게 함으로서 PASCAL VOC2007, 2012같은 벤치마크에서 검출 성능이 크게 뛰어올랐다.

 

0.3 결과

- 이 덕분에 데이터셋을 더 크게, 더 어렵게 만들수 있게 되었으며, MS COCO 데이터셋을 통해 결과를 확인하였다.

- OHEM을 물체 검출 분야에서 최신 기법들과 결합함으로서 PASCAL VOC 2007, 2012에서 각각 78.9%, 76.3% mAP 결과가 나왔다.

 

 

300x250
728x90

arxiv.org/abs/1406.4729

 

[Submitted on 18 Jun 2014 (v1), last revised 23 Apr 2015 (this version, v4)]

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

 

1. 요약

1.1 현황

- 현존하는 심층 합성곱 신경망들은 고정 크기의 (e.g 224 x 224) 입력 이미지를 받고 있습니다. 이러한 요구사항은 이미지 혹은 고정 크기/스케일 하부이미지의 인식 정확도를 떨어트릴수도 있습니다.

 

1.2 특징

- 이 연구에서는 이러한 요구 사항을 제거하기 위해 "공간 피라미드 풀링 Spatial Pyramid Pooling"이라고 부르는 조금 다른 풀링 방법을 사용한 신경망을 사용하였습니다.

- 이 새로운 신경망 구조를 SPP-net이라고 부르며, 이미지 크기와 스케일에 무관하게 고정된 길이의 표현 결과를 만들어 낼수가 있습니다.

- 피라미드 풀링은 물체 변형들에도 object deformation에 강인합니다.

 

1.3 연구

1.3.1 이미지 분류

- 이러한 장점으로 SPP-net은 CNN 기반 이미지 분류들을 개선 시킬수 있었습니다.

- 이미지넷 2012 데이터셋의 경우, SPP-net은 다르게 설계된 CNN 아키텍쳐들의 정확도를 끌어올릴수 있었습니다.

- PASCAL VOC 2007과 Caltech 101 데이터셋에서도, SPP-net은 단일 이미지 표현을 사용해서, 미세 조정없이 최신의 분류 성능을 얻어낼 수가 있었습니다.

 

1.3.2 물체 검출

- SPP-net은 물체 검출에도 큰 효과를 보였는데, SPP-net을 사용하여 전체 이미지로부터 특징맵을 구해내고, 검출기를 학습 시키기 위해서 고정 길이들의 표현들을 생성시키도록  특정 영역에서 특징들을 풀링 시킵니다.

- 이 방법은 합성곱 특징들을 반복적으로 계산하는 것을 방지시킵니다.

- 테스트 이미지를 처리할때 R-CNN보다 24-102배 더 빨라졌으며, PASCAL VOC 2007데이터에서 상당히 더 정확해졌습니다.

- 이미지넷 큰 규모의 시각 인식 대회 ILSVRC 2014에서 물체 검출에서 2등을, 이미지 분류에서 38팀 중에서 3등을 차지하였습니다.

 

 

300x250
728x90

arxiv.org/abs/1506.01497

[Submitted on 4 Jun 2015 (v1), last revised 6 Jan 2016 (this version, v3)]

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun

 

 

 

1. 초록

1.1 현황

- 최신 물체 검출 신경망들은 물체의 위치를 구해내기 위해서 영역 제안 알고리즘들을 사용하고 있습니다.

- 기존의 SPPnet이나 Fast R-CNN과 같은 방법들은 신경망의 물체 검출 동작 시간을 줄여왔으나 제안 영역을 구하는 과정에 병목 현상이 발생되고 있습니다.

 

1.2 특징

- 그래서 이 논문에서는 영역 제안 신경망 Region Proposal Network RPN을 소개하고자 합니다. 이 RPN은 합성곱 특징들을 검출 신경망으로 나눔으로서 제안 영역을 구하는데 비용을 줄여내었습니다.

- RPN은 Fast R-CNN에서 물체 검출에 사용되었던 부분과 같이 고 품질의 제안 영역들을 생성하도록 학습 됩니다.

- 그 다음 RPN과 Fast R-CNN을 합성곱 특징들을 공유하도록하여 합쳐진 하나의 신경망으로 만들어 지는데, 여기서 어텐션 메커니즘이 사용되며 RPN이 어떤 부분을 보아야 하는지 알려주는것이 되겠습니다.

 

1.3 결과

- VGG-16 모델을 백본으로 사용하였을때, 검출 시스템은 GPU로 5fps의 속도를 보였으며, PASCAL VOC 2007, 2012, 그리고 MS COCO 데이터셋의 이미지 당 300 제안 영역을 구하도록  하였을때 물체 검출에 있어서 높은 정홧도를 보였습니다.

- ILSVRC와 COCO 2015년 대회에서 Faster R-CNN과 RPN은 여러 부문에서 1등을 수상할수 있엇습니다.

 

300x250
728x90

arxiv.org/abs/1504.08083

 

1. 초록

1.1 소개

- 본 논문에서는 물체 검출을 위한 빠른 영역 기반 합성곱 신경망 Fast R-CNN을 소개합니다.

- Fast R-CNN은 심층 합성곱 신경망을 사용하여, 이전 연구 결과 보다 더 효과적으로 물체 영역을 찾아내도록 만들었습니다.

- 이전의 연구와 비교해보면, Fast R-CNN은 검출 정확도 뿐만 아니라 훈련, 테스트 속도 또한 크게 증가시켰습니다.

 

1.2 결과

- Fast R-CNN은 VGG16 신경망으로 학습시켰으며 R-CNN보다 9배 빨라졌고, 실행시에는 213배 더 빨라졌습니다.

- SPPnet과 비교하면, VGG16을 사용한 Fast R-CNN은 3배가 더 빨랐고, 테스트시에는 10배, 그리고 더 정확하였습니다.

 

 

300x250
728x90

arxiv.org/abs/1311.2524

 

 

1. 초록

1.1 현뢍

- 기존의 PASCAL VOC 데이터셋으로 측정한 물체 탐지 성능은 이전 몇년간 큰 변화는 없었었다.

- 최고의 성능을 보였던 방법은 고 수준 컨텍스트와 여러 저수준 이미지 특징들을 혼합시킨 복잡한 앙상블 시스템이었다.

 

1.2 성과

- 본 논문에서는 단순하고, 유연한(scalable) 물체 검출 알고리즘을 제안하는데, mean average precision(mAP)가 이전의 VOC 2012에서 mAP 53.3%로 최고 성능을 보였던것에서 30% 증가하였다.

 

1.3 특징

- 우리가 제안한 방법은 두가지 핵심 개념을 가지고 있는데, 첫번째는 제안된 영역에다가 합성곱 신경망을 적용하여 물체를 구분하고 위치를 찾아냅니다. 두 번째는 라벨링된 훈련셋 자체가 적은 경우 영역 단위로 미세조정하여 성능을 크게 끌어올릴수 있었습니다.

- 영역 제안과 CNN을 결합하였으므로 이 방법을 R-CNN이라 불렀습니다.( CNN 특징들을 가진 영역들)

 

1.4 결과

- R-CNN과 비슷한 CNN 아키텍처에다가 슬라이딩 윈도우 검출기를 기반으로 제안된 OverFeat를 비교하였는데, R-CNN이 ILSVRC2013 검출 데이터셋에서 훨씬 큰 격차로 좋은 성능을 내었습니다.

 

300x250
728x90

 

 

300x250
728x90

arxiv.org/pdf/2009.11189.pdf

 

1. Abstract

- 양적 투자 Quantitative investment는 수익을 최대화하고, 금융 거래 중에 발생가능한 위험의 최소화를 목표로 하고 있습니다.

 * Quantitative investment : 최적의 수익률을 낼 수 있도록 수학적 모델링, 컴퓨터 시스템과 데이터 분석을 활용한 투자 방법 

- 최근 양적 투자에 있어서 인공지능 기술의 거대한 잠재력과 빠른 발전으로, 인공지능을 활용한 양적 연구와 실제 투자에 사용이 증가하고 있습니다.

- 양적 투자 기법들이 활용되어 왔으나, 인공지능 기술들이 질적 투자 시스템에 도전해오고 있습니다.

- 특히 새로운 양적 투자에 대한 학습 파라다임은 혁신적인 워크 플로우를 따르도록 인프라를 개선시키고자하며, 그래서 데이터 주도 인공지능 기술은 좋은 성능을 내는 인프라를 필요로 하고 있습니다. 금융 시나리오들 중에서 다양한 문제들을 풀기 위해서 인공지능 기술을 적용시키는 것에는 몇가지 어려움들이 존재합니다.

- 이러한 어려움과 인공지능 기술과 양적 투자 사이의 갭을 다루고자, 우리는  양적 투자 분야에서 인공지능의 가치를 만들어내고 연구를 수행하며, 잠재력을 알아내고자 Qlib를 개발하였습니다.

 

 

 

 

 

 

 

 

300x250
728x90

openaccess.thecvf.com/content_ICCV_2019/html/Lin_COCO-GAN_Generation_by_Parts_via_Conditional_Coordinating_ICCV_2019_paper.html

 

 

 

1. Abstract

1.1 현황

- 사람은 생물학적 제한 때문에 주위 환경의 일부와만 상호작용을 할수 있다보니 주위 환경을 관척한 정보로 공간적인 관계를 추론할수 있도록 학습하였다.

 

1.2 소개

- 사람과 마찬가지로 기계도 연산량에 있어서 제약을 가지고 있으므로, 좌표 조건부 GAN(COCO-GAN)을 소개하는데 이 모델의 생성자는 공간적 좌표를 조건으로 하는 파츠들을 이용해서 이미지를 생성해낸다.

- 판별자의 경우 일관성과 지역적 외양, 에지 크로싱 연속성을 가지도록 패치들이 합쳐진것이 실제인지 아닌지 판별하도록 학습한다.

- 학습 과정에서 전체 이미지를 조정하지 않더라도, COCO-GAN은 최신의 고품질 이미지들을 만들어 낼수가 잇다.

- 생성시킨 이미지들을 추가하여, COCO-GAN은 기존의 훈련 샘플들보다 더 많은 이미지를 만들수가 있으며, 이를 beyond-boundary generation이라고 부른다.

 

 

 

 

300x250
728x90

1. Abstract

1.1 현황 

- 강화 학습 방법들이 만들어지면서 알고리즘 트레이딩을 포함한 다양한 방면들에서 활용되고 있다.

 

1.2 소개

- 본 논문에서 주식 거래는 상태, 동작, 리워드로 마르코브 성질을 가지고 있는 것들을 이용한 게임으로 보고

- 금융 상품을 거래하는 시스템을 소개하고, 실험하였다.

- 이 시스템은 다양한 비동기 actor와 critic 신경망 아키텍처를 기반으로한다.

 

1.3 실험

- 실제로 데이터를 익명화하여 실험을 수행함.

- 가장 좋은 주식 거래를 한 아키텍처의 경우 RTS 선물 시세엣 연간 66%의 수익을 얻을수가 있었습니다.

300x250

+ Recent posts