본문 바로가기

Python3

6. 복잡한 데이터 표현하기 6-1. 객체지향 API로 그래프 그리기 화려한 그래프 만들기 pyplot 방식 완벽하게 규칙을 가지고 있지는 않지만, 대체로 이 형식을 따름. plt.plot([1, 4, 9, 16]) plt.title('simple line graph') plt.show() 객체지향 API 방식 fig, ax = plt.subplots() ax.plot([1, 4, 9, 16]) ax.set_title('simple line graph') fig.show() 발행년도 vs 출판사 산점도 그리기 fig, ax = plt.subplots(figsize=(10, 8)) ax.scatter(ns_book8['발행년도'], ns_books['출판사']) ax.set_title('출판사별 발행도서') fig.show() 마커 .. 2023. 6. 5.
4. 데이터 요약하기 4-1. 통계로 요약하기 # describe 메서드 ns_book6.describe() ns_book7.describe(percentiles=[0.3, 0.6, 0.9]) ns_book7.describe(include='object') # 숫자아니어도 포함 # 평균 ns_book7['대출건수'].mean() # 중앙값 ns_book7['대출건수'].median() # max, min ns_book7['대출건수'].max() ns_book7['대출건수'].min() # 분위수 ns_book6['대출건수'].quantile(0.25) ns_book6['대출건수'].quantile([ ]) # 분산 ns_book7['대출건수'].var() # 표준편차 ns_book7['대출건수'].std() # 최빈값 ns_.. 2023. 6. 5.
3. 데이터 정제하기 3-1. 불필요한 데이터 삭제하기 ns_book = ns_df.loc[:,'번호':'등록일자'] # loc 메서드와 불리언 배열 selected_columns = ns_df.columns != 'Unnamed 13' ns_book = ns_df.loc[:, selected_columns] ns_book.head() # or drop # dropna exis=0 (세로) ns_book = ns_df.dropna(axis=1) ns_book = ns_df.dropna(axis=1, how='all') # [] 연산자와 불리언 배열 selected_rows = ns_df['출판사'] == '한빛미디어' ns_book2 = ns_book[selected_rows] ns_book2 = ns_book[ns_book.. 2023. 6. 5.
728x90