Welcome to your CDK TypeScript project

This is a blank project for CDK development with TypeScript.

The cdk.json file tells the CDK Toolkit how to execute your app.

gpu template is added

prerequisite

- G and VT on Demend & Spot(비용 아끼기) vCPU Quota 할당 필요

Main Stacks

Lambda+Gateway Stack

AI cluster abstract

aws ac

세팅

AI 추론 클러스터 VPC와 mongoDB VPC 피어링
클러스터 VPC에서 실제 피어링단과 상호작용하는 서브넷의 라우팅 테이블을 MongoDB vpc 피어링 속성으로 추가
ingress피어링도 추가해야됨, 몽고디비 잘 돌아갈때까지 피어링 말고 기다려
그러한 private Subnet은, AI 추론 전용 API 단과 연결되어있어, 여기서 MongoDB와 유일통신. 중개 API를 모두 모아서 관리

ECS 기반 배포단 구성 이유

- 실제 업무계와 달리 이 추론계는 데이터의 연산 및 결과를 API 형태로 업무계에 제공하는 단순한 역할을 함
- 또한 업무계에서 사용자의 Traffic 및 이에 관한 overhead를 선제적으로 EKS에서 처리하고, 상대적으로 secondary한 요청 형태로 traffic이 추론계에 도달
- EKS보다 COST가 저렴하다. 일반적인 상황에선 GPU 비용 및 할당가능한 최대 Quota를 고려해야 하기때문에, 비슷하게 트래픽 밸런싱(스케일링)기능이 있지만, 저렴한 ECS 채용

Lambda 함수 사용 이유

- 초기 설계에는 업무계와 추론계가 동일한 VPC에 함께 존재했다. subnet간의 통신 접근보다는 독자적으로 중간 중개역할을 하는 Lambda를 VPC에 할당해서 사용하려고 했음
- Lambda에 할당된 서비스는 bedrock호출 및 VPC Peering된 DB에 Data를 Transfer 하는 기능임. 
- bedrock 호출은 bedrock 관련 Quota 및 AWS 자체 서버자원을 사용하기에 람다를 사용해도 무방하다고 판단했고
- 어차피 bedrock 호출부에서 데이터 접근이 1차적으로 가능하기에 개발 단순성을 위해 DB 데이터 전송을 함께함.
- data form은 text 뿐이라 초기 서비스 형태에서는 Lambda 함수의 트래픽 처리 스케일링이 큰 단위로 일어나지 않는다고 판단함(비용이 저렴)

상품 정보 -> 임베딩 특성 값으로 추론 및 증강 -> Atlas DB에 저장(Only peering을 통한 접근)

커스텀 장바구니 상품 메타데이터로 제목 생

ad - 2주전 만든 임시자료

-굳이 넣고싶다면, DB 피어링 AWS 서비스 밖으로 뺴자, 통신구조 더 간단하게 해도 무방함 이젠 ..

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
bin		bin
custom-cart		custom-cart
lambda		lambda
lib		lib
mongo		mongo
test		test
.gitignore		.gitignore
.npmignore		.npmignore
README.md		README.md
cdk.context.json		cdk.context.json
cdk.json		cdk.json
jest.config.js		jest.config.js
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Welcome to your CDK TypeScript project

prerequisite

Main Stacks

Lambda+Gateway Stack

AI cluster abstract

aws ac

세팅

ECS 기반 배포단 구성 이유

Lambda 함수 사용 이유

상품 정보 -> 임베딩 특성 값으로 추론 및 증강 -> Atlas DB에 저장(Only peering을 통한 접근)

커스텀 장바구니 상품 메타데이터로 제목 생

ad - 2주전 만든 임시자료

composer set

모든 origin 에 대한 요청이 모두 유효함 (통신 test 완료): 추후 alb에 inbound 제약조건 활성화

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Welcome to your CDK TypeScript project

prerequisite

Main Stacks

Lambda+Gateway Stack

AI cluster abstract

aws ac

세팅

ECS 기반 배포단 구성 이유

Lambda 함수 사용 이유

상품 정보 -> 임베딩 특성 값으로 추론 및 증강 -> Atlas DB에 저장(Only peering을 통한 접근)

커스텀 장바구니 상품 메타데이터로 제목 생

ad - 2주전 만든 임시자료

composer set

모든 origin 에 대한 요청이 모두 유효함 (통신 test 완료): 추후 alb에 inbound 제약조건 활성화

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages