본문 바로가기
Study/소프트웨어공학&비즈니스애널리틱스 (최성철 교수님) 2023-2

SageMaker Studio에서 ML 분석하기

by JejuSudal 2023. 11. 11.

https://blog.kico.co.kr/2022/03/08/hands-on-sagemaker-studio-%ED%99%9C%EC%9A%A9%ED%95%98%EA%B8%B0/

 

[Hands On] SageMaker Studio 활용하기 – 교보정보통신 기술 블로그

 

blog.kico.co.kr

과정

 

1. S3 데이터 업로드

  • AWS Management Console > S3 메뉴 > 버킷만들기를 클릭합니다.
  • 버킷이름(예, s3-wyc-sagemaker) > AWS 리전(아시아 태평양(서울) ap-northeast-2 선택) > 버킷만들기를 클릭합니
  • 폴더 만들기(house_prices) > 하위 data, submit 폴더를 생성합니다.
  • data 폴더에 데이터 파일을 업로드합니다.
2. SageMaker Studio 도메인 생성 및 사용 설정
  •  Amazon Sagemaker > SageMaker Studio 열기를 클릭합니다.
  • IAM 역할 생성시 파일 업로드 된 특정 S3 버킷에 대한 접근 권한을 부여할 수 있습니다. 
  • VPC, Subnet을 선택합니다. dafault 값으로 선택하여 진행.
  • VPC를 통해 네트워크 액세스 및 인터넷 연결을 세부적으로 제어가능하도록 지원됩니다.
  • 도메인 생성이 완료 되면 사용자 추가에 프로파일이 생성되어져서 조회되어집니다. 앱 시작 버튼을 클릭합니다.
  • 사용자를 추가하여 해당 도메인을 공유하여 사용할 수 있습니다.

 

<SageMaker Studio에서 ML 분석하기>

  •  

데이터 분석 → 목적변수 전처리 → 설명변수 전처리 → 설명변수 확인하여 특징 값 생성 → 하이퍼파라메터 최적화 → 최종 결과물 생성

 

  • 목적변수 : 예측하고 싶은 정보입니다.
  • 설명변수 : 예측에 사용하는 정보입니다.
  • 특징값 : 데이터의 여러 특징을 나타내는 정보, 설명 변수를 가공한 정보, 데이터의 특성을 알아야 하기 때문에 여러분야의 배경지식이 필요합니다.
  • 하이퍼파라메터 : 머신러닝에서 하이퍼파라미터는 최적의 훈련 모델을 구현하기 위해 모델에 설정하는 변수로 학습률(Learning Rate),  훈련 반복 횟수, 가중치 초기화 등을 결정할 수 있습니다. 또한 하이퍼파라미터 튜닝 기법을 적용하여 훈련 모델의 최적값들을 찾을 수 있습니다.

 

728x90