자신에게 친절할 것 :)
728x90
반응형

2024/06/09 2

[EDA] 데이터 합치기 .merge; inner join, left outer join, right outer join, full outer join

# 코드잇 데이터 사이언스 강의 듣는 중1. inner join2. left outer join3. right outer join4. full outer join     1. inner join  - 겹치는 부분만 합치겠다는 의미.- 아래 예시를 보면 겹치는 3 상품만 합쳐져서 결과 값이 나옴 --> .merge(A, B, on='')          - 이 경우에 inner join 값은 product이기 때문에 on에 넣어줌 pd.merge(price_df, quantity_df, on='Product') 2. left outer join - 왼쪽 값만 합치겠다는 것. 오른 쪽 데이터에 없더라도- 예시를 보면 왼쪽의 상품은 전부 포함되지만,오른쪽에 겹치지 않는 제품들은 NaN으로 표시됨.  -->..

Data Science/Pandas 2024.06.09

[EDA] 카테고리 분류, .groupby

# 코드잇 데이터 사이언스 강의 듣는 중- .groupby --> 카테고리 분류를 편하게 하는 기능  - DataFrameGroupBy type을 사용하면 분류하는 것이 굉장히 쉬워짐. + sql문이 이건가..?- 하여튼 변수에 groupby 메소드를 쓰면 알아서 보기 편하게 변수에 따른 통계치나 플랏을 볼 수 있게 만들어줌.  - 새로운 변수를 따로 만들어서 사용하는 것이 편리한 듯 --> type은 DataFrameGroupBynation_groups = df.groupby('brand_nation')type(nation_groups)#pandas.core.groupby.generic.DataFrameGroupBy - 그럼 이것저것 메소드 가능해짐 - .count() --> 각 변수 별로 카운트 해줌..

Data Science/Pandas 2024.06.09
728x90
반응형