https://blog.kico.co.kr/2022/03/08/hands-on-sagemaker-studio-%ED%99%9C%EC%9A%A9%ED%95%98%EA%B8%B0/
[Hands On] SageMaker Studio 활용하기 – 교보정보통신 기술 블로그
blog.kico.co.kr
과정
1. S3 데이터 업로드
- AWS Management Console > S3 메뉴 > 버킷만들기를 클릭합니다.
- 버킷이름(예, s3-wyc-sagemaker) > AWS 리전(아시아 태평양(서울) ap-northeast-2 선택) > 버킷만들기를 클릭합니
- 폴더 만들기(house_prices) > 하위 data, submit 폴더를 생성합니다.
- data 폴더에 데이터 파일을 업로드합니다.
2. SageMaker Studio 도메인 생성 및 사용 설정
- Amazon Sagemaker > SageMaker Studio 열기를 클릭합니다.
- IAM 역할 생성시 파일 업로드 된 특정 S3 버킷에 대한 접근 권한을 부여할 수 있습니다.
- VPC, Subnet을 선택합니다. dafault 값으로 선택하여 진행.
- VPC를 통해 네트워크 액세스 및 인터넷 연결을 세부적으로 제어가능하도록 지원됩니다.
- 도메인 생성이 완료 되면 사용자 추가에 프로파일이 생성되어져서 조회되어집니다. 앱 시작 버튼을 클릭합니다.
- 사용자를 추가하여 해당 도메인을 공유하여 사용할 수 있습니다.
<SageMaker Studio에서 ML 분석하기>
데이터 분석 → 목적변수 전처리 → 설명변수 전처리 → 설명변수 확인하여 특징 값 생성 → 하이퍼파라메터 최적화 → 최종 결과물 생성
- 목적변수 : 예측하고 싶은 정보입니다.
- 설명변수 : 예측에 사용하는 정보입니다.
- 특징값 : 데이터의 여러 특징을 나타내는 정보, 설명 변수를 가공한 정보, 데이터의 특성을 알아야 하기 때문에 여러분야의 배경지식이 필요합니다.
- 하이퍼파라메터 : 머신러닝에서 하이퍼파라미터는 최적의 훈련 모델을 구현하기 위해 모델에 설정하는 변수로 학습률(Learning Rate), 훈련 반복 횟수, 가중치 초기화 등을 결정할 수 있습니다. 또한 하이퍼파라미터 튜닝 기법을 적용하여 훈련 모델의 최적값들을 찾을 수 있습니다.
728x90
'Study > 소프트웨어공학&비즈니스애널리틱스 (최성철 교수님) 2023-2' 카테고리의 다른 글
드디어 lamda로 구운 나의 커스텀 모델 (3) | 2023.11.21 |
---|---|
뉴스 클리핑 분류 KoBERT 모델 설명 (0) | 2023.11.11 |
사용할 AWS DB 서비스 (0) | 2023.11.07 |
ANIOP git 올릴때 주의사항 (0) | 2023.11.07 |
Docker Compose (1) | 2023.11.06 |