DS가 되기 위한 여정 👩‍💻
728x90
반응형

AI/Machine Learning 6

[elice 머신러닝] 머신러닝 프로젝트 진행과정

*elice 강의안- 과적합을 진짜 주의해야 함. - 반드시 나눠야 함. test_size=0.3 -> 0.3을 평가에 사용하고 0.7을 훈련에 사용하겠다는 것- 과적합은 훈련데이터에 치중되서 새로운 데이터에 대해서는 성능이 떨어짐.. - 과적합 검증용으로 사용됨. - 5번 검증을 거치고 5개의 평균을 사용함. [학습용 데이터와 평가용 데이터 분리]train_test_split()import numpy as npfrom sklearn.model_selection import train_test_splitfrom elice_utils import EliceUtilselice_utils = EliceUtils()# 랜덤한 [40,4] 크기의 dataset 생성dataset = np.random.random..

AI/Machine Learning 2025.05.06

[elice 머신러닝] 머신러닝 라이브러리 NumPy

*elice 강의 수강중* - 속력이 빨라지기 때문에 동일한 데이터 타입을 갖도록 하는 것. - 리스트 *2 2개를 연속적으로 나타낸것. +도 마찬가지. => so, numpy가 필요 - start는 포함, stop은 포함 안 됨. !- 기본이 float니깐, 정수로 하려면  꼭 dtype = int 넣어줘야 함. - 배열로 주고 싶으면, (3,3) 이렇게 튜플로 한 번 더 묶어줘야 함. - 배열로 주고 싶으면, (3,3) 이렇게 튜플로 한 번 더 묶어줘야 함. - - size 간격 아니고, 총 개수를 의미함.   array5 = np.arange(0, 10).reshape(1,10) --> 2차원 배열을 요구할 경우 이렇게 해야함. 랜덤으로 하지말고 -- 이거 엘리스 인 ai가 틀림.. 아니..

AI/Machine Learning 2025.03.13
728x90
반응형