DS가 되기 위한 여정 👩‍💻
728x90
반응형

2025/05/12 3

[elice pandas] 데이터 변환 (map(), apply(), lambda 함수) , 데이터 요약/추출

* elice 강의안 - .map()을 python에서 매핑 해주는 것과 달리 pandas에서는 df의 특정 열 전체를 바꾸는데 사용 - apply()는 똑같이 함수 적용할 때 씀- 변환 할 때마다 함수를 지정해줘야 함..- 그럼 코드 더러워지니깐 lambda 씀- 위처럼 합쳐서 코드 짜면됨. - 와,, 함수 값을 그대로 df에 넣을 수 있는지는 몰랐음. - group by 주의할 것 [Boolean indexing] [loc]- loc를 사용할 때는 [인덱스 이름, 컬럼이름] 순서임. - 불리안 인덱싱 할 땐 "인덱스 이름" 위치에 넣어야 함. [iloc]연속적인 객체(데이터프레임의 인덱스) 범위를 지정해 가져오는 방법인 슬라이싱을 활용하면 범위를 지정하여 해당 범위에 해당하는 데이터들을 불러올 수..

Data Science/Pandas 2025.05.12

[elice pandas] ',' , '-' replace 간단하게 하기, 형변환

*elice 강의안 - object type을 int로 바꾸기 위한 강의 내용 중에서 코드가 진짜 간단해서 적어둠. - 매번 할 때마다 헷갈리는 건데 아래처럼 하면 될 듯. `info()`를 사용해 데이터의 타입을 확인해보면 모든 데이터가 수가 아닌 텍스트(Object) 타입으로 저장되어 있습니다. 이는 즉 데이터에 있는 3,359는 숫자 3359가 아닌 텍스트 "3,359"가 저장되어있는 상태입니다. 이 상태로는 숫자의 연산, 나아가 평균값과 같은 통계량을 측정할 수 없습니다. 따라서 우리는 이 텍스트(Object)들을 모두 **정수형(int)** 으로 바꾸어야 합니다. 정수형으로 바꾸기 위해선 텍스트에서 숫자만을 남기고 모두 제거해야 합니다. 이를 위해 숫자로 바꾸어야 하는 컬럼들에서 `str.re..

Data Science/Pandas 2025.05.12
728x90
반응형