클라우드 서비스 공급 업체인 마이크로소프트 애저(Azure), 아마존 웹 서비스(Amazon Web Service, 이하 AWS), 구글 클라우드 플랫폼(Google Cloud Platform, 이하 GCP)의 2024년도 1분기 클라우드 매출 및 수익은 생성형 AI에 대한 강력한 수요에 힘입어 예상을 뛰어넘는 실적을 기록했다. 해당 기간 이들 기업은 총합 537억 달러의 매출을 올렸으며, 전 분기 대비 26억 달러 증가한 수치를 기록했다. 애저는 전년 대비 31.1%의 매출 성장률로 선두를 차지했고, GCP도 전년 대비 매출이 28.4% 증가하며 뛰어난 성과를 거뒀다. 가트너(Gartner)에 따르면 전체 클라우드 지출은 2027년까지 IT 지출의 58%를 차지하며, 연평균 18%의 성장률을 보일 것으로 예상된다.

 


클라우드 커버 시리즈 소개

BCG의 클라우드 커버 시리즈(Cloud Cover Series)는 진화하는 클라우드 산업에 대한 최신 데이터, 인사이트 및 뉴스를 제공하며, 특히 AWS, 애저, GCP 등 주요 클라우드 서비스 제공 업체 세 곳을 중점적으로 다룬다. 이번 호에서는 클라우드 산업의 가격 변동뿐만 아니라 서버리스 서비스와 가격, 그리고 생성형 AI 모델 미세 조정(fine-tuning)의 장단점에 대해 집중적으로 다루고자 한다.


 

BCG는 클라우드 지출이 증가함에 따라 BCG의 NPI(Nimbus Pricing Index)를 사용해 최근의 가격 변화를 주시하고 있다. 3대 클라우드 서비스 플랫폼의 평균 가격을 일정 환율에 따라 미국 달러로 환산한 NPI는 지난 2023년 11월 클라우드 커버 리포트 이후 0.4%의 소폭 하락세를 보였다. 신규 고비용 지역으로 인해 GCP의 평균 가격이 0.9% 상승한 것이 감소폭을 상쇄하는 역할을 했다. AWS는 고비용 지역인 케이프타운에서 일부 컴퓨팅 서비스를 중단하면서 부분적으로 가격이 떨어졌다.

애저는 컴퓨팅 요율 조정으로 2024년 상반기 클라우드 서비스 플랫폼 중 유일하게 기존 지역의 요금을 변경했다. (보기 1 참조) 스토리지 및 네트워크 요금은 동일하게 유지됐다. 애저의 가격 조정으로 전 세계 대부분 지역에서도 소폭의 변화가 있었으며, 오사카(+$128), 아부다비(+$31), 케이프타운(+$30), 뭄바이(-$50), 상파울루(-$105) 등에서는 가장 큰 가격 변화가 일어났다. 오사카 지역의 가격이 크게 인상되었음에도 불구하고 애저는 여전히 가장 낮은 요금을 제공하고 있다. 또한 애저는 도쿄의 경쟁력 있는 가격 덕분에 일본에서 가장 저렴한 클라우드 서비스 플랫폼으로 자리 잡고 있다.

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 1

 

 

클라우드 플랫폼 추가 서비스 지역

 

2024년 상반기 AWS, 애저, GCP 등이 모두 서비스 지역을 추가했으나 확장 전략에서는 뚜렷한 차이를 보였다. (보기 2 참조) 애저(텔아비브, 바르샤바)와 AWS(텔아비브, 캘거리)는 두 곳, GCP는 네 곳(베를린, 사우디아라비아 담맘, 도하, 사우스캐롤라이나)에 서비스를 추가했다.

GCP는 텔아비브에 서비스를 확장한 애저와 AWS 때문에 텔아비브의 독점 사업자 포지션을 잃게 됐지만 GCP의 연간 요금은 1,575달러로 지역 내 가장 낮은 수준이고 애저보다는 약간, AWS보다는 연간 147달러 더 저렴하다. 한편, AWS는 캘거리의 첫 번째 서비스 공급 업체임에도 불구하고 연간 1,671달러로 토론토보다도 높은 요금이 형성돼 있다. 전반적으로 AWS의 캐나다 요금이 제공 업체 중 가장 높게 책정돼 있다.

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 2

한편, GCP는 담맘(Dammam)을 추가해 사우디아라비아에 위치한 최초의 업체가 되었지만, 브라질 및 남아프리카 공화국과 비슷한 수준인 연간 2,222달러의 높은 요금을 책정했다. GCP는 또한 도하에서 연간 1,723달러의 요금을 형성하고 있으며, 이는 해당 지역 내 또 다른 사업자인 애저보다 연간 150달러 저렴한 수준이다. GCP는 올해 상반기 베를린에 서비스를 시작해 애저와의 경쟁에서 다시 한번 우위를 점했으나 애저보다 연간 124달러 높은 요금을 도입하며 낮은 가격 경쟁력을 보였다. 최종적으로 GCP는 사우스캐롤라이나에 서비스를 추가로 공급하며 버지니아, 오하이오에 이어 미국에서 세 개의 허브를 가진 최초의 플랫폼 사업자가 되었다.

 

 

서버리스 서비스

 

2015년 AWS 람다(Lambda) 서비스가 도입된 이후 서버리스는 클라우드 컴퓨팅 분야의 모멘텀을 일으켰으며, 궁극적으로 업계가 차세대 IT 아키텍처를 개발하는 방식에 혁신을 가져올 것으로 전망된다. (부록 1을 통해 다양한 레벨의 관리 인프라 참조)

데브옵스(DevOps) 팀은 서버리스를 통해 코드를 실행하는 서버를 신경 쓰지 않고 애플리케이션과 서비스를 구축하고 실행할 수 있으며, 서버의 프로비저닝, 확장, 유지 관리 대신 코드, 프로세스 및 업그레이드 절차를 개선하는 데 집중할 수 있다. AWS 람다(Lambda), 애저 펑션(Azure Functions), 구글 클라우드 펑션(Google Cloud Functions) 등이 현재 서버리스 클라우드 시장에서 가장 영향력 있는 제품으로 고려되고 있다. (보기 3 참조)

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 3

 

 

서버리스 가격

 

서버리스의 단점은 기존의 가상 머신 가격 모델과 달리 특정 매개변수 집합에 대한 가격이 지역마다 일관되지 않다는 점이다. (가격 차이 부록 2 참고, 도시별 가격은 부록 3 참고) 시장에서 유일하게 모든 지역에서 일관된 단위당 가격을 제공하는 애저는 엔지니어링 팀들이 비용 효율적인 지역을 고려하지 않고 애플리케이션을 실행할 수 있다는 점에서 높이 평가되고 있다. (보기 4 참조)

세 공급 업체의 가격을 비교해 보면 현재 애저가 모든 지역에서 가장 저렴하며, AWS, GCP 순으로 그 뒤를 따른다. AWS는 대부분의 지역에서 평균 4~9% 비싼 반면, GCP는 20~60% 높은 가격을 형성하고 있다. GCP의 프리미엄 가격에도 불구하고 일부 지역에선 GCP의 2세대 서버리스 컴퓨팅 비용이 약 두 배에 달하는 등 높은 가격대를 보이지만 월 단위 무료 요청에 가장 관대한 할당을 제공하는 것이 특징이다. 따라서 무료 요청 볼륨이 적은 애플리케이션의 경우, GCP가 더 경제적인 대안이 될 수 있다.

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 4

 

 

가격 최적화

 

대부분의 비용 청구는 서비스 사용량이 기준이지만 일부 서비스는 고객이 구성 매개 변수를 선택해 부분적으로 청구 금액을 결정할 수 있기 때문에 가격을 최적화할 수 있는 기회를 제공한다. 예를 들어, AWS 람다(Lambda) 함수는 트리거 될 때 할당받는 ‘컴퓨팅 리소스’의 양을 MB 메모리 단위로 측정해 정의한다. 함수의 비용은 할당된 컴퓨팅 리소스와 실행에 걸리는 밀리 초(milliseconds) 수에 따라 달라진다. 따라서 기업은 함수의 비용을 최적화하기 위해 더 적은 컴퓨팅 리소스 할당과 더 빠른 실행 시간을 목표로 해야 한다. (보기 5 참조)

AWS는 메모리 외에도 더 큰 전력에 더 많은 CPU를 할당해 함수 실행 속도를 높인다. 최적의 전력 구성을 결정하는 것은 가장 빠른 실행과 가장 낮은 비용 사이의 최적점을 찾는 것을 의미한다. 예를 들어, 보기 5와 같이 128MB일때 실행 시간은 35초, 1.5GB인 경우는 3초 미만으로 단축되는 반면, 실행 비용은 14% 더 저렴해진다.

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 5

 

 

생성형 AI 모델 미세 조정

 

지난 클라우드 커버 리포트에서는 생성형 AI 모델의 ‘구축 대비 구매’ 비용을 추정하는 프레임 워크에 대해 논의한 바 있다. (부록 4 참고) 당시 ‘구매’ 모델은 맞춤형 옵션이 없는 기성 제품을 의미했다. 이번 보고서에는 ‘구매’ 모델 사례에 대해 더 자세히 살펴보고 생성형 AI 모델의 미세 조정 여부를 결정할 때 필요한 고려 요소를 살펴보고자 한다.

미세 조정에는 보통 사전 학습된 모델과 사용자 정의 데이터 세트가 포함된다. 사전 학습된 모델은 레이블이 지정되지 않은 대규모 데이터 세트를 1차 학습한 범용 모델이다. 이러한 모델은 이후 실제 작업에 적합하도록 더 작고 구체적인 데이터 세트로 추가 학습되거나 ‘미세 조정’되는 과정을 거친다. 모델은 미세 조정을 통해 특정 필드나 데이터 세트의 미세한 뉘앙스를 학습하여 더 나은 예측과 번역 또는 기타 결과물을 도출, 기업의 요구 사항에 더 잘 부합할 수 있다.

맞춤형 모델은 몇 가지 단점을 가지고 있다. 일반 모델보다 더 많은 리소스 및 컴퓨팅 전력을 필요로 하기 때문이다. 미세 조정에 사용되는 데이터는 때로 편향을 일으키거나 영속시킬 수 있기 때문에 공정성과 연관성을 확보하기 위한 신중한 선택과 모니터링이 필요하다.

 

 

미세 조정 비용

 

생성형 AI 모델을 미세 조정하는 비용은 주로 학습 데이터 세트 크기와 학습에 필요한 반복 횟수(에포크)에 따라 달라진다. 일반적으로 반복 횟수가 많을수록 데이터에 더 많이 노출되어 모델이 더 정교해진다. 보다 간단하고 규모가 작은 활용 사례의 경우, 보통 5~10번의 에포크로 훈련하는 것을 권장한다.

모델 복잡성이 증가함에 따라 미세 조정 비용도 증가하여 단순 모델의 경우, 0.032백만 달러, 평균 모델의 경우 0.48백만 달러, 복잡한 모델의 경우 0.64백만 달러까지 상승한다(복잡 모델 시나리오는 부록5 참조). 모델이 구축된 후에는 모든 사용 계층에서 모델을 실행하는 데 필요한 자원이 기하급수적으로 증가한다. 흥미로운 것은 사전 학습된 모델에서 미세 조정된 모델로 갈수록 사용 비용이 증가하지만, 복잡 모델의 경우 증가 규모가 단순 모델(8배) 및 평균 모델(12배)에 비해 덜 급격하다는 점이다(4.5배). (보기 6~8 참조)

또한 사용량이 적을 때는 단순 모델이 더 나은 효율성을 제공하지만, 사용량이 많을 때는 복잡 모델이 더 경제적일 수 있다는 점도 주목할 필요가 있다. 복잡 모델은 사용량이 많을 때 평균 모델보다 실행 비용이 적게 들 수 있기 때문이다. (보기 9 참조) 이를 통해 모델 복잡성과 예상 사용량을 일치시키는 것이 성능과 비용 최적화를 위해 매우 중요하다는 점을 알 수 있다.

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 9

클라우드 커버 리포트의 다음 호에서는 지속적인 NPI 분석과 함께, 전문 서비스, 클라우드 서비스 공급업체 및 가격 변화 관련 클라우드 서비스 및 가격에 대한 주요 질문을 다룰 예정이다. 또한, 가상 머신(Virtual Machines, 이하 VM) 시스템 구축의 경제성 대비 서버리스 기능을 비교하는 보다 자세한 분석도 수행할 예정이다.

 

 


부록

 

 

 

 

 

BCG 클라우드 커버(Cloud Cover): 신규 지역 확장, 서버리스 서비스, 맞춤형 GenAI 18뉴스레터 구독하기