DS가 되기 위한 여정 👩‍💻
728x90
반응형

분류 전체보기 253

7/25 agent 활용이 장점만 있을까.

오늘 TIL 3줄 요약LLM: cv반이지만, agent를 위해 llm도 알아야 한다며 수업하심. 모르는 용어가 많아서 어려웠음. 아니.....강사님... 좋다고 하자마자 바뀌시다니.. 아쉬움 cauality 오랜만인데.. 결국 연방론을 계속 하는 느낌이다. 아직도 대학원인 거 같애.강연 보면, 결국 AI agent를 얼마나 잘 쓰냐에 따라서 업무 효율성이 달라진다는데, 그냥 엑셀 처음 나왔을 때의 시장 반응이 이러지 않았을까.TIL (Today I Learned) 날짜2025. 07. 25 배운 것 & 소감LLM의 경우 모델 저장부터 Vectorization을 함께 해야 함. ML로 밖에 안 해봐서 DL로 하는 것은 상당히 생소했다. 예시 데이터가 영어인데도 돌리면서도 감정분석이 잘 되지 않는 거..

TIL 2025.07.26

7/24 과제를 하면 복습이 잘 됨

오늘 TIL 3줄 요약DL: 데이터 EDA부터 유닛 수와 depth, 규제, dropout에 따른 모델의 학습 정확도와 오류 비교 -> 과제로 이해도 상승미니 팀프로젝트로 나름 고민하면서 튜닝했는데, 생각보다 test set에서 결과가 안 나와서 과적합 원인이 궁금했음. 보고서 지옥TIL (Today I Learned) 날짜2025. 07. 24 배운 것 & 소감데이터를 EDA부터 모델학습까지 한 번에 해서 어떤 지점들을 살피고 비교해야 하는지를 배워서 좋았음 특히, 강사님 과제를 좋아하는 편인데 시간을 타이트하게 주시는 것은 좀 힘들지만, 확실하게 학습 내용을 recap하는 과제라 좋음. 미니프로젝트는 결과가 아쉬움. 공동 3등은.. 꼴찌지..아니 회귀가 적절해 보이긴 했는데 역시.. simple i..

TIL 2025.07.24

[팀원 축소] 노력하기 싫음 vs 나가기 왜 양자택일로 사는 것임

...........2달을 주제를 찾았고지난달에 해커톤도 신청하고본격적으로 프로젝트 들어간지 일주일만에 나가는게 도저히이해가 안 간다. .........작년 부트캠프 때부터 못 따라오는 분인 것은 알았지만,모두들 그렇게 발전해 간다. 나랑 첫 과제 팀원이었고, 다들 그만두거나 포기해서유일하기에 끝나고도 계속 스터디 하고 이번 프로젝트도 같이 하자고 했는데..... 그렇게 됐다. 작년 빌런들과 비교도 못할 정도로상냥하게 해주었건만결과를 가져오던가 같이 하기 어려울 거 같다는 말에 결국 나간다고 팀원들에게 공지도 없이 톡부터 나갔다. 팀장으로서 매번 이러니 열이 받다못해....팀원들에게 문제가 있냐고 물었으나, 본인들은 좋다고 하셔서 그냥 냅두기로 했다. 사실 전공상이상한 사람을 빠르게 탐지하고 분석하..

7/22 상당히 바쁨

오늘 TIL 3줄 요약이거를......................................... 굳이.딥러닝 강의 시작 (무슨 말인지 모르겠음), 미니 팀프로젝트 전처리 EDA 취합 후 모델학습 시작 (모르겠다고, 아무것도 안 힐거면 왜 있는거지?)LG Aimers 강의 중 공급망관리(SCM) 개념 배움 TIL (Today I Learned) 날짜2025. 07. 22 배운 것 & 소감딥러닝........ 솔직히 코랩으로 빠르게 넘어가고, 각각을 자세하게 설명하는 형식이 아니라 코드로 돌리는 결과값만 보여주는 형태라 직관적 이해가 어려움. -> 우리가 모르는 것은 행렬곱과 multiply가 같냐인데 -> 다르다. 스스로 공부할 것. 가르칠게 많은 건 알겠는데 귀에서 그냥 흘러가는 느낌임. 그래서..

TIL 2025.07.22

[정보처리기사 2025 2회차 실기 후기] 가채점 붙은듯 ㅎㅎ!!!

!!! 드디어 1년만에 정처기를 안 봐도 된다!!!! + 너무 바빠서.. 진짜 오랜만에 글 쓴다. 작년 이맘 때 24년 2회차 실기를 처음으로 봤는데 막 빅데이터 부트캠프 들어갔고데이터 쪽이니깐 정처기 필요없겠지 30% + 원래 전공 그만두고 우울 70%로 실기 공부를 열심히 안했다. 특히, 마지막 일주일을.. 결국 떨어졌는데.. 그 때의 나에게.. 넌 1년을 하게 될 거야 라고 말해주고 싶달까...ㅎ 와,, 왠만한 시험들은 조금 하면 붙는데 이건 프로그래밍 언어때문에 기출 조금 본다고 되는 것이 아니었다..24년 2회차가 가장 쉬웠고,, 계속 어려웠다.그래서 이번 4트까지 매 시험을 볼 때마다 공부량을 계속 늘려왔고,3회차의 경우에는 최종 프로젝트 기간이라 공부를 많이 못하긴 했다. 25년 1회차는 ..

Blah Blah 2025.07.22

[elice 통계] 추론 및 가설검정 (이산확률 분포)

*elice 강의안- 이항 분포가 정규분포로 넘어가는 과정도 볼 것. -> 동전던지기나 주사위 던지기로 생각하면 됨. -> 베르누이 실행은 그냥 경우의 수는 2개라고 생각하고 각각 독립이라서 각각의 확률이 p는 1-p가 됨. - 이항분포랑 정규분포는 이해하고 넘어가야 함!!- 갑자기 조합이 나오네..- 아 이게 조합이.. 기억이 잘 안나는데.. - 조합은 n개중에서 r개를 고르는 경우의 수 => 그니깐 위처럼 괄호 안의 위아래로 두는 것이 조합의 표기임.(n)(r) = n! / r!(n-r)! - ... 와 파스칼의 삼각형 처음 들어봤는데 직작에 알았으면 저거 썼을 텐데 싶다..- 아 이게 그니깐 2개 중 x개를 2개 골라야 하니깐 y는 0개 골라서 2C0- 2xy는 2개를 뽑는데 y는 1개고 - ..

[elice 통계] 확률(사건/확률, 순열/조합, 조건부확률/독립, 확률분포)

*elice 강의안- 배반은 관계를 의미하는 것으로 a와 b는 상호배반이라고 주로 이야기함. - 재귀함수: 자기 자신을 호출하는 것 - 공리: 누구나 다 참으로 받아들이는 것- 숫자 간 가림막이 있다고 생각했을 때, 뽑힌 순서는 중요하지 않기 때문에 가림막의 개수에 따라서만 달라짐. - 위치는 상관이 없음. 어떻게든 3개만 뽑으면 되는 거라서- 색칠된 박스가 가림막이라고 생각하면 6개의 칸 중에서 3개의 가림막이 있다고 가정하는 것이 중복조합과 같음. - 결국 n+r-1Cr 이 서로 다른 n개의 대상 중 중복허을 허용해 r개를 순서 고려 없이 뽑는 경우를 의미함- 이산확률 변수인 경우 명확한 값이 있으니깐 확률 질량 함수가 됨. - 이항분포 특히 기억할 것. - 확률밀도함수에서는 구간에 대한 값을 가질 ..

[데이터 사이언티스트 직무부트캠프 후기] 코멘토 DS 과정 매우 추천

본 후기는 직무부트캠프를 직접 구매하고 수강한 후 작성하였으며, 후기 작성 이벤트에 참여하여 소정의 원고료를 받았습니다. - 이미 끝난 지 2달이 가까워져 가지만 이제서야 후기를 쓰게 되었다. - 그만큼 굉장히 만족스러웠고, 현재는 다른 캠프를 신청해뒀으며, 2주 후부터 시작할 예정이다. [직무부트캠프 수강 계기]- '멀티캠퍼스'의 6개월짜리 부트캠프 수료 후에 취업설명회 등을 듣다가 코멘토 제휴쿠폰을 받게 되어 신청하였다. - 부트캠프에서는 대개 1~2개 정도의 프로젝트를 하게 되는데, 이것으로 포트폴리오를 채우기에는 너무나 부족하다.- 이에 프로젝트도 채울 겸 직무에 대한 경험도 늘릴 겸 신청하게 되었다. ["데이터사이언티스트와 함께하는 인공지능 프로젝트 A to Z : 모델링부터 서빙까지"..

Blah Blah 2025.05.24

[elice 통계] 상자 그림 box plot, 두 변수 범주형 요약: 분할표(crosstab), 두 변수 수치형 요약: 산점도, 공분산, 상관계수

*elice 강의안- 수염의 길이로 데이터의 분포도 확인이 가능함. - 이게 sql할 때 이중 그룹바이였나.. 하여간 좀 복잡하게 하는 방법이 있었는데..import numpy as np import pandas as pdimport matplotlib as plt# 데이터 불러오기mart = pd.read_csv("mart.csv")print(mart)# Q1.지역별로 선호하는 마트region_crosstab = pd.crosstab(mart["region"], mart["mart"])print(region_crosstab)# Q2. 가족구성원의 수별로 선호하는 마트famnum_crosstab = pd.crosstab(mart["family_num"], mart["mart"])print(famnum_..

[elice 통계] 논리적 자료의 요약(평균, 중간값, 최빈값, 분산, 사분위수, cv, 도수분포표)

*elice 강의안 - 이미 통계에 많이 접한 사람들은 저런 낚는 용에 넘어가지 않음. - 모수는 다른 것이 될 수도 있지만, 중심위치와 퍼진 정도를 중요하게 생각함. - so, 양 극단(최대, 최소)를 빼고 평균을 내기도 함. - 새로 들어온 값 있을 때마다 다시 확인해야 하기 때문에 잘 사용하지 않음.- 특히, 데이터 값이 많을 수록 자주 사용하지 않음. - 최빈값은 넘파이에 없음. scipy의 stats를 가지고 와야 함. - stats.mode()import numpy as npfrom scipy import statscoffee = np.array([202, 177, 121, 148, 89, 121, 137, 158])# 최빈값 계산cf_mode = stats.mode(coffee)print(..

728x90
반응형