혼자 공부하는 데이터 분석 with python2 4. 데이터 요약하기 4-1. 통계로 요약하기 # describe 메서드 ns_book6.describe() ns_book7.describe(percentiles=[0.3, 0.6, 0.9]) ns_book7.describe(include='object') # 숫자아니어도 포함 # 평균 ns_book7['대출건수'].mean() # 중앙값 ns_book7['대출건수'].median() # max, min ns_book7['대출건수'].max() ns_book7['대출건수'].min() # 분위수 ns_book6['대출건수'].quantile(0.25) ns_book6['대출건수'].quantile([ ]) # 분산 ns_book7['대출건수'].var() # 표준편차 ns_book7['대출건수'].std() # 최빈값 ns_.. 2023. 6. 5. 3. 데이터 정제하기 3-1. 불필요한 데이터 삭제하기 ns_book = ns_df.loc[:,'번호':'등록일자'] # loc 메서드와 불리언 배열 selected_columns = ns_df.columns != 'Unnamed 13' ns_book = ns_df.loc[:, selected_columns] ns_book.head() # or drop # dropna exis=0 (세로) ns_book = ns_df.dropna(axis=1) ns_book = ns_df.dropna(axis=1, how='all') # [] 연산자와 불리언 배열 selected_rows = ns_df['출판사'] == '한빛미디어' ns_book2 = ns_book[selected_rows] ns_book2 = ns_book[ns_book.. 2023. 6. 5. 이전 1 다음 728x90