DS가 되기 위한 여정 👩‍💻
728x90
반응형

2025/05/06 3

[elice 머신러닝] dataframe 문제..

- 너무 헷갈려서.. 머신러닝 2 안 하고 전처리 판다스 부분 강의 다시 들어야 겠다 import numpy as npimport pandas as pdA = pd.DataFrame(np.ones((5, 5)) * 2)B = pd.DataFrame(np.ones((7, 7)) * 3)print("DataFrame A \n", A)print("DataFrame B \n", B)# Pandas 연산자를 활용해 행렬의 연산을 해보세요.# NaN 값이 발생한다면 그 자리에는 -1을 채우세요.# A + B (행렬의 덧셈)add = A.add(B,fill_value=-1)print(add,'\n')# A - B (행렬의 뺄셈)sub = A.sub(B, fill_value=-1)print(sub,'\n')# A *..

Data Science/Pandas 2025.05.06

[elice 머신러닝] 머신러닝 프로젝트 진행과정

*elice 강의안- 과적합을 진짜 주의해야 함. - 반드시 나눠야 함. test_size=0.3 -> 0.3을 평가에 사용하고 0.7을 훈련에 사용하겠다는 것- 과적합은 훈련데이터에 치중되서 새로운 데이터에 대해서는 성능이 떨어짐.. - 과적합 검증용으로 사용됨. - 5번 검증을 거치고 5개의 평균을 사용함. [학습용 데이터와 평가용 데이터 분리]train_test_split()import numpy as npfrom sklearn.model_selection import train_test_splitfrom elice_utils import EliceUtilselice_utils = EliceUtils()# 랜덤한 [40,4] 크기의 dataset 생성dataset = np.random.random..

AI/Machine Learning 2025.05.06

[Essence of linear algebra] ch4. Matrix multiplication as composition

https://www.youtube.com/watch?v=XkY2DOUCWMU&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab&index=4 "It is my experience that proofs involving matrices can be shortened by 50% if one throws the matrices out."— Emil Artin "내 경험에 따르면, 행렬을 사용하는 증명은행렬을 없애버리면 50%는 줄일 수 있다."- 에밀 아르틴 - 오늘의 시작 문장은 이것이다. 그니깐.. 문제는 행렬이야.. - shear: 다시 밀어버리는 것 => 이러면 다시 선형변환임. - *다소 헷갈려서 아래에 추가했음. - 단순한 회전과 shear 와는 다름. -> 두 개의 선..

728x90
반응형