자신에게 친절할 것 :)
728x90
반응형

Data Science 37

[Jupyter Notebook] 폴더 생성 및 파일 이동

강의를 따라서 듣다가 폴더를 구분해 놓지 않고 쓰고 있었다는 것을 확인하고 만들어서 data.csv는 저장했는데도 계속 에러가 떴다.  이건 현재 running 중인 파일이 데이터가 있는 폴더와 같은 폴더에 있지 않아서 생긴 문제였다.그래서 옮기려고 했는데 잘 안 되서 검색해서 방법을 확인했다.  어떻게 해도 ui 상에서는 이동이 안 되어서 주피터 노트북 상에서 그냥 폴더를 생성하고 기존 것은 삭제 했다.(그냥 내가 방법을 못 찾은 것일지도 모르겠다. ;;) 구글 ,,, 검색은 중구난방이라 그냥 gpt에게 물어봤다. 5단계로 나눠서 셀에 입력하라고 추천했고, 경로 때문에 조금 헤매다가 경우 방법을 찾았다.  1. 현재 작업 디렉토리 확인import osprint("Current working direct..

[Pandas] numpy와 pandas 비교, pd.DataFrame(), header 변경

#코드잇 데이터 사이언스 강의 듣는 중 - 판다스는 기본적으로 넘파이를 바탕으로 만들어서 발전시킨 것--> 외부 데이터 읽고 쓰기, 정리된 데이터 새로운 파일에 저장, 데이터 시각화 가능--> 넘파이보다 표 형식을 다루는 것에 능함. 넘파이는 복잡한 수학 연산을 할 때 사용.  - Pandas DataFrame: 2차원 형태의 데이터를 다루기 위한 자료형- Pandas Series: 1차원 형태의 데이터를 다루기 위한 자료형 --> dataframe은 사실상 여러 개의 series로 구성된 것. - 열: column --> 데이터의 특징 - 행: row/index --> 레코드 (각각에 대한 정보)  Numpy ArrayPandas DataFrame- 인덱스 값(숫자)로 칼럼을 표현- 2차원 넘파이 배열..

Data Science/Pandas 2024.05.20

[Numpy] 기본 수 연산, 불리안 연산 , 기본 통계, numpy array 와 python list 비교

#코드잇 데이터 사이언스 강의 듣는 중 넘파이는 진짜 너무 편리해서파이썬은 for문으로 연산하려는 값을 하나씩 확인해줘야 하는 데 그냥 더 해주면 됨. #python...for i in range(len(array1)): array1[i] = array1[i] * 2#이걸 그냥 넘파이는 변수에다가 냅다 곱해주면 되고, 값을 저장하고 싶으면#변수 명을 주면 됨. #array1 = array1 * 2array1 * 2  - 불린 인덱싱 / 마스킹- 특정 조건에 따라 가리는 것을 의미함. - 불리안도 그냥 np.array에 확인하고 싶은 수식 여부만 작성하면 됨. array1 = np.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31])array1 > 4#해당 값은 전부 Tru..

Data Science/Numpy 2024.05.20

[Numpy] 인덱싱, 슬라이싱

인덱싱은 python이랑 거의 같음 기본적으로 [0]에서 시작하는 게 같고,[-1]이 제일 끝인 것도 같음.  - 한 번에 여러 개를 인덱싱할 수도 있음. - 인덱싱할 위치를 지정한 배열을 만들고, 그것을 배열에 적용하는 것도 가능. import numpy as nparray1 = np.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31])array1[0] #2array1[5] #13array1[-1] #31array1[[1, 3, 4]] #array1([3, 7, 11])array2 = np.array([2, 1, 3])array1[array2] #array([5, 3, 7]) - 슬라이싱도 기본적으로 똑같음 - array1[ :6] --> 0(처음)부터 5까지- arra..

Data Science/Numpy 2024.05.19

[Numpy] 배열

주피터 노트북으로 하는 중 - 넘파이 배열은 numpy.array로 만들어줌. 타입은 numpy.ndarray --> n dimentional array--> 3차원도 가능하기 때문import numpy#1차원 배열은 파이썬 리스트를 array 메소드의 파라미터로 넣어줌array1 = numpy.array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31])array1#array([2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31])#배열 타입type(array1)#numpy.ndarray#배열 모양; 차원 확인array1.shape#(11,)#요소 개수array1.size#11#----------#2차원 배열은 행마다 []로 끊어줌.array2 = numpy...

Data Science/Numpy 2024.05.19

[Jupyter Notebook] print() 랑 그냥 변수 명 입력 시 출력물 차이

- jupyter는 print() 안하고 바로 변수 명을 입력해도 값을 출력할 수 있음.  but, 그렇게 하면 여러 개 동시 입력 시 모든 값을 프린트하는 print()와 달리, 가장 마지막 값만 프린트 함.  - pandas를 써서 예쁘게 csv를 출력 하려면, print(df) 말고 걍 값 df를 바로 입력해야 이쁘게 보임. --> print 쓰면 r처럼 보이고 값만 입력하면 엑셀 처럼 보임.

[Jupyter Notebook] markdown 표시 들

# 가장 큰 제목## 두 번째로 큰 제목### 세 번째로 큰 제목#### 이것은 4단계 제목입니다. 그냥 글 **두껍게** 쓰거나, *기울여* 쓸 수 있음.  리스트도 쓸 수 있음. * list item 1* list item 2* list item 3=> bullet으로 나옴  ordinary도 숫자로 쓰면 됨.1. 처음2. 두 번째3. 세 번째 줄 바꿈은 space 2번하고 + enter 문단을 바꾸려면 엔터 2번 이탈릭체는 *별표* 나 _언더바_로볼드체는 **별표**나 __언더바 2개__.**별표와 _언더바_** 섞어서 가능.   //별표와 언더바  섞어서 가능. 취소선은 ~~물결~~로. (가운데 그어짐)  링크 걸기 가능. 내가 만든 첫 투두 리스트는 [모멘툼](https://tashapark.g..

728x90
반응형