This is a blank project for CDK development with TypeScript.
The cdk.json file tells the CDK Toolkit how to execute your app.
gpu template is added
- G and VT on Demend & Spot(비용 아끼기) vCPU Quota 할당 필요
- AI 추론 클러스터 VPC와 mongoDB VPC 피어링
- 클러스터 VPC에서 실제 피어링단과 상호작용하는 서브넷의 라우팅 테이블을 MongoDB vpc 피어링 속성으로 추가
- ingress피어링도 추가해야됨, 몽고디비 잘 돌아갈때까지 피어링 말고 기다려
- 그러한 private Subnet은, AI 추론 전용 API 단과 연결되어있어, 여기서 MongoDB와 유일통신. 중개 API를 모두 모아서 관리
- 실제 업무계와 달리 이 추론계는 데이터의 연산 및 결과를 API 형태로 업무계에 제공하는 단순한 역할을 함
- 또한 업무계에서 사용자의 Traffic 및 이에 관한 overhead를 선제적으로 EKS에서 처리하고, 상대적으로 secondary한 요청 형태로 traffic이 추론계에 도달
- EKS보다 COST가 저렴하다. 일반적인 상황에선 GPU 비용 및 할당가능한 최대 Quota를 고려해야 하기때문에, 비슷하게 트래픽 밸런싱(스케일링)기능이 있지만, 저렴한 ECS 채용
- 초기 설계에는 업무계와 추론계가 동일한 VPC에 함께 존재했다. subnet간의 통신 접근보다는 독자적으로 중간 중개역할을 하는 Lambda를 VPC에 할당해서 사용하려고 했음
- Lambda에 할당된 서비스는 bedrock호출 및 VPC Peering된 DB에 Data를 Transfer 하는 기능임.
- bedrock 호출은 bedrock 관련 Quota 및 AWS 자체 서버자원을 사용하기에 람다를 사용해도 무방하다고 판단했고
- 어차피 bedrock 호출부에서 데이터 접근이 1차적으로 가능하기에 개발 단순성을 위해 DB 데이터 전송을 함께함.
- data form은 text 뿐이라 초기 서비스 형태에서는 Lambda 함수의 트래픽 처리 스케일링이 큰 단위로 일어나지 않는다고 판단함(비용이 저렴)
-굳이 넣고싶다면, DB 피어링 AWS 서비스 밖으로 뺴자, 통신구조 더 간단하게 해도 무방함 이젠 ..







