📝 논문
Public Spot Instance Dataset Archive Service.pdf
다양한 클라우드 업체의 스팟 인스턴스 가격 및 특성 분석.pdf
발표 포스터
Public Spot Instance Dataset Archive Service_poster.pdf
🔗 Github
https://github.com/ddps-lab/spotlake
✍️ 문제 제기
- 클라우드 벤더들이 제공하는 스팟 인스턴스는 비용 효율적이지만 갑작스러운 중단 위험이 있음
- 클라우드 벤더들은 스팟 인스턴스의 효율적인 사용을 위해 다음과 같은 데이터셋을 제공
- 스팟 인스턴스 가격 데이터
- 이전 기간의 중단 비율
- 현재 가용성 데이터
- 그러나 이러한 스팟 데이터셋은 일반 사용자들이 활용하기에는 다음과 같은 어려움이 있음
- 데이터의 접근의 문제
- 클라우드 제공 업체마다 스팟 데이터가 서로 다른 위치에 존재
- 각각 접근 매커니즘이 서로 다름 (SDK, CLI 또는 웹 인터페이스)
- 데이터 쿼리 구성과 갯수에 제한이 있음
- 대부분의 스팟 데이터셋 최신 정보만 제공하고 과거 데이터가 부족한 문제:
- 과거 스팟 데이터를 이용한 심층적인 분석과 데이터셋 모델링이 어려움
- 사용자들이 과거 스팟 데이터를 활용하여 스팟 인스턴스를 최적화하여 사용하기 어려움
- 이러한 문제들을 극복하고자 스팟 데이터 아카이브 웹 서비스인 SpotLake를 제안
🚧 핵심 기여
- 다양한 제약을 극복하고 여러 클라우드 제공업체(AWS, GCP, Azure)의 데이터를 포함 스팟 인스턴스 데이터셋을 수집
- 웹 기반의 서비스로 구현, 사용자들이 쉽게 접근할 수 있도록 함
- 이 데이터를 활용하여 클라우드 사용자와 시스템 연구자들이 비용 효율적이고 신뢰할 수 있는 환경을 구축하는 데 도움을 줄 수 있음