DS가 되기 위한 여정 👩‍💻
728x90
반응형

전체 글 233

[Essence of linear algebra] ch.5 Three-dimensional linear transformations

https://www.youtube.com/watch?v=rHLEWRxRGiM&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab&index=5 Lisa: Well, where’s my dad?Frink: Well, it should be obvious to even the most dimwitted individual who holds an advanced degree in hyperbolic topology that Homer Simpson has stumbled into… (dramatic pause) the third dimension. Lisa: 음, 우리 아빠는 어디 계세요?Frink: 음, 고차원적인 위상수학(하이퍼볼릭 토폴로지)에 정통한 사람이라면, 아무리 멍청한 사람이..

[elice 머신러닝] dataframe 문제..

- 너무 헷갈려서.. 머신러닝 2 안 하고 전처리 판다스 부분 강의 다시 들어야 겠다 import numpy as npimport pandas as pdA = pd.DataFrame(np.ones((5, 5)) * 2)B = pd.DataFrame(np.ones((7, 7)) * 3)print("DataFrame A \n", A)print("DataFrame B \n", B)# Pandas 연산자를 활용해 행렬의 연산을 해보세요.# NaN 값이 발생한다면 그 자리에는 -1을 채우세요.# A + B (행렬의 덧셈)add = A.add(B,fill_value=-1)print(add,'\n')# A - B (행렬의 뺄셈)sub = A.sub(B, fill_value=-1)print(sub,'\n')# A *..

Data Science/Pandas 2025.05.06

[elice 머신러닝] 머신러닝 프로젝트 진행과정

*elice 강의안- 과적합을 진짜 주의해야 함. - 반드시 나눠야 함. test_size=0.3 -> 0.3을 평가에 사용하고 0.7을 훈련에 사용하겠다는 것- 과적합은 훈련데이터에 치중되서 새로운 데이터에 대해서는 성능이 떨어짐.. - 과적합 검증용으로 사용됨. - 5번 검증을 거치고 5개의 평균을 사용함. [학습용 데이터와 평가용 데이터 분리]train_test_split()import numpy as npfrom sklearn.model_selection import train_test_splitfrom elice_utils import EliceUtilselice_utils = EliceUtils()# 랜덤한 [40,4] 크기의 dataset 생성dataset = np.random.random..

AI/Machine Learning 2025.05.06

[Essence of linear algebra] ch4. Matrix multiplication as composition

https://www.youtube.com/watch?v=XkY2DOUCWMU&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab&index=4 "It is my experience that proofs involving matrices can be shortened by 50% if one throws the matrices out."— Emil Artin "내 경험에 따르면, 행렬을 사용하는 증명은행렬을 없애버리면 50%는 줄일 수 있다."- 에밀 아르틴 - 오늘의 시작 문장은 이것이다. 그니깐.. 문제는 행렬이야.. - shear: 다시 밀어버리는 것 => 이러면 다시 선형변환임. - *다소 헷갈려서 아래에 추가했음. - 단순한 회전과 shear 와는 다름. -> 두 개의 선..

[elice 머신러닝] 통계분석

*elice 강의안 ##### 정규 분포 평균 분산import numpy as npimport matplotlib.pyplot as pltfrom elice_utils import EliceUtilselice_utils = EliceUtils()# 랜덤 값 고정np.random.seed(0)# 정규 분포 파라미터 설정mean = 2std = 1# 정규 분포 샘플링n_samples = np.random.normal(mean, std, 1000)count, bins, ignored = plt.hist(n_samples, 20, density=True)# Plot the distribution curveplt.plot(bins, 1/(std * np.sqrt(2 * np.pi)) * np.exp( - (bi..

[elice 머신러닝] 확률 변수와 조건부 확률

*elice 강의안 =============> 확률문제도 기억이 안 나..문제 요약:박스 안에 숫자 공들이 있음:‘1번’이 적힌 공: 5개‘2번’이 적힌 공: 3개주머니:1번 주머니: 까만 구슬 7개, 흰 구슬 3개2번 주머니: 까만 구슬 4개, 흰 구슬 6개절차:박스에서 무작위로 공 하나를 꺼냄 (1번 또는 2번이 적혀 있음)그 번호에 해당하는 주머니에서 무작위로 구슬을 하나 꺼냄→ 이때, 꺼낸 구슬이 흰색일 확률은?​=> a+b = 113 베이지안 확률 계산 - 중복제거를 잊으면 안 됨 set()import numpy as np# 집합 A, B 설정A = [1, 2, 3, 4]B = [2, 4, 6, 8, 10, 12]# prior 계산 함수P_A = len(A)/len(set(A+B))P_B..

[elice 머신러닝] 미분 기초, 편미분

*elice 강의안- 일단 앞 파트 완벽하게 이해 안됐는데.. 그때까지 미룰 수는 없으니깐 우선 끝내자 - p보다 약간 큰 것의..기울기..?- 진짜 설명 너무 못 함.- 접선의 기울기와 평균 기울기를 가깝게 만드는 것 - 곱셈과 덧셈에 닫혀 있음. - h에 속미분이 나온대.... 돌겠네..[편미분] - [x 미분 값, x] 가 답임..[다항 함수 미분]- 미분 너무 오랜만인데.. 함수 쓴 거랑 직접 수식 쓴 값이랑 비교하는 코드임.import numpy as npimport sympy from sympy import *# sympy 변수 설정x, y = symbols('x y') # f(x) 함수 초기화sym_f = sympy.expand((x-2*y)**2)print("Before differen..

[elice 머신러닝] 랭크를 활용한 선형 방정식

*elice 문제랭크를 활용한 선형 방정식행렬 A의 랭크는 column spaces의 기저를 의미합니다. 이러한 랭크는 선형 방정식 Ax=b의 해의 종류를 판별할 때 사용되기도 합니다.이번 실습에서는 선형 방정식 Ax=b를 풀어 해의 존재 여부를 판별하고 존재 한다면 그 해를 구합니다.주어진 선형 방정식은 아래 수식을 만족합니다.Ax1​=bx1​=[1,0,0]T - 아래가 코드인 건데.. 솔직히 활용도나 왜 쓰는 지가 전혀 이해되지 않음. import numpy as npimport scipyimport scipy.linalg# A,b 초기화A = np.array([[1, 2, 3],[2, -1, -1], [3, 1, 2]])b = np.array([[1],[2],[3]])# 유일한 해를 갖는지 확인r..

[Essence of linear algebra] ch3. Linear transformations and matrices

https://www.youtube.com/watch?v=kYB8IZa5AuE&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab&index=3 이번에는 엘리스 해당 파트 듣기 전에 이걸 먼저 듣고, 넘어가보려고 한다. Unfortunately, no one can be told what the Matrix is. You have to see it for yourself. — Morpheus (Surprisingly apt words on the importance of understanding matrix operations visually.) - 매트릭스 영화에서 나온 대사인 건데.. ㅎ 진짜 꼭 시각적으로 봐야 한다. 안 그러면 이해가 안돼.. 일단 나는.. - 그냥 외우지 말..

728x90
반응형