Performance and Capacity Considerations (성능과 공간 고려사항)
- 머신러닝 시스템을 위한 복잡성 고려
- 훈련의 비교와 복잡성 평가
- 분석
- 대규모 시스템에서의 성능과 공간 고려
- 계층, 깔때기 기반 모델링 접근
머신 러닝 기반의 시스템에 관련 한 작업에서 목표는 일반적으로 성능과 공간 요구조건을 만족시키면서 메트릭스들 (참여율, 등)을 향상시키는 것이다. 두가지 머신러닝 시스템 구축 단계에서 중요한 성능과 공간의 토론이 나타난다.
- 훈련 시간: 얼마나 많은 훈련 데이터와 공간이 Predictor 를 구축하는데 필요한가?
- 평가 시간: Service level agreement (SLA) 이 무엇인가?
머신 러닝 모델 기술을 선택하는 것으로 그 시스템을 구축하는 과정 결정을 사용하고 훈련 시간과 평가시간의 복잡도를 측정하는 것과 같이 머신러닝 작업을 최적화시키면서 성능과 공간을 고려해야만 한다.
Complexities consideration for an ML system
머신 러닝 알고리즘들은 세 가지의 복잡성을 가지고 있다.
- 훈련 복잡성 (Training complexity): 머신러닝 알고리즘의 훈련 복잡성은 주어진 작업을 위해 모델이 훈련해야하는 시간이다.
- 평가 복잡성 (Evaulation complexity): 머신러닝 알고리즘의 평가 복잡성은 테스팅 시간에 입력 값을 평가하기 위해 걸리는 시간이다.
- 샘플 복잡성 (Sample complexity): 머신러닝 알고리즘의 샘플 복잡성은 목표로하는 기능을 성공적으로 학습시키기 위해 요구되는 훈련 샘플들의 수를 말한다. 샘플 복잡성은 모델의 공간이 바뀔때 변화한다.
- 예시: 딥 신경망 알고리즘에서, 훈련 예제들의 갯수는 결정 트리 (Decision trees) 들과 선형 회귀 (Linear Regression) 보다 상당히 크다.
'컴퓨터공학 > Machine Learning Study' 카테고리의 다른 글
P-value란? 유의 확률 (0) | 2022.10.26 |
---|---|
[Machine Learning] Bias-Variance Tradeoff (0) | 2022.09.27 |
[머신러닝 시스템 디자인 스터디 Part5]Offline model building and evaluation (0) | 2022.08.14 |
[머신러닝 시스템 디자인 스터디 Part4]Architecting for Scale (0) | 2022.08.12 |
[머신러닝 시스템 디자인 스터디 Part3]Defining metrics (0) | 2022.08.11 |