분류 전체보기350 [K-mooc] 7. Ensemble Learning 성신여대 김영훈 교수님의 K-MOOC 실습으로 배우는 머신러닝 강의 내용을 바탕으로 포스팅하였습니다. 2차시: Ensemble Learning 소개 1. Ensemble Learning DT는 분류나 예측에 대해 높은 해석력을 가진다는 장점이 있지만 데이터의 작은 변화에 민감하다는 한계를 가지고 있다. 이러한 한계를 극복하기 위해 사용하는 것이 바로 앙상블 모형이다. 가. 정의와 Random Forest 앙상블 알고리즘은 약한 분류기들이 모여서 voting을 진행하고 강력한 분류기를 구성하는 알고리즘으로 여러개의 모형이 합쳐져 집단지성을 발휘하는 알고리즘이라고 할 수 있다. 여러 모델이 모여 있기 때문에 한 모델에서 예측이 빗나가더라도 다른 모델에서 보정이 가능하다는 장점이 있고, 일반적으로 다양한 머신.. 강의 내용 정리하기/실습으로 배우는 머신러닝 2022. 11. 22. [K-mooc] 6. Decision Tree 성신여대 김영훈 교수님의 K-MOOC 실습으로 배우는 머신러닝 강의 내용을 바탕으로 포스팅하였습니다. 1차시: Decision Tree 1. Decision Tree 🌳 가. 정의 분류와 회귀 작업 및 다중 출력 작업도 가능한 다재다능한 머신러닝 방법론 IF-THEN 룰에 기반해 해석이 용이하다. (화이트 박스 모델) - 변수 하나 하나에 적합한 분할을 한다 - 한 번에 한 개의 변수를 사용하여 정확한 예측이 가능한 규칙들의 집합을 생성 일반적으로 예측 성능이 우수한 RF의 기본 구조 CART 훈련 알고리즘을 이용해 모델을 학습함 나. DT 기본 구조 및 용어 ✔️ Root node: 분할 전의 초기의 상태 ✔️ Branch: edge라고 부르기도 하며, 노드에서 노드로 가는 길목 ✔️ Decision .. 강의 내용 정리하기/실습으로 배우는 머신러닝 2022. 11. 22. [K-mooc] 4. Model Learning with Optimization 성신여대 김영훈 교수님의 K-MOOC 실습으로 배우는 머신러닝 강의 내용을 바탕으로 포스팅하였습니다. 머신러닝에서 학습이란 최적화이며, 최적화란 loss를 minimize해주는 방식을 정의하는 것이다. 2차시: 경사하강법 개요 Iterative Algorithm-based Optimization: 일반적인 상황에서 사용할 수 있는 최적화 방법 1. Gradient Descent(경사하강법) gradient는 기울기, 경사를 의미하며 기울기가 작아지는 방향을 찾고 해당 방향으로 한 걸음씩 계속 내려가는 방식을 의미한다. 그럼 왜 기울기일까? 기울기의 방향은 함숫값을 가장 빠르게 올려줄 수 있는 뱡향을 의미한다. 그 반대 방향으로 가게 되면 반대로 함숫값이 가장 빠르게 줄어들게 될 것이다. 우리의 목표는 l.. 강의 내용 정리하기/실습으로 배우는 머신러닝 2022. 11. 22. [TIL] 20221121(월) 나는 오늘 무엇을 했는가? 1. K-mooc 실습으로 배우는 러닝머신 1강~3강 듣기(성신여대 김영훈 교수님) 2. 깃 허브 사용법 익히기 3. 미니 프로젝트 2 나는 오늘 무엇을 느꼈는가? 깃 허브 생소해서 어렵지만, 커밋하는게 생각보다 재밌다! 총 공부시간 12시간 10분 복습 및 회고/TIL 2022. 11. 21. [K-mooc] 3. Classification(KNN, 로지스틱 회귀모형) 성신여대 김영훈 교수님의 K-MOOC 실습으로 배우는 머신러닝 강의 내용을 바탕으로 포스팅하였습니다. 1차시: 머신러닝 분류 모델링 1. Bias-Variance Trade off 가. Bias 예측 값이 실제 값과 얼마나 떨어져 있는가? 혹은 얼마나 치우쳐져 있는가? 쉽게 말해서 error, 오차라고 생각할 수 있다. 나. Variance 우리에게 주어진 데이터는 보통,모집단으로부터 샘플링된 데이터이다. 이때 모집단은 굉장히 큰 데이터 집단이며, 어떤 방식으로 샘플링 하느냐에 따라 여러 종류의 샘플 데이터가 생성될 수 있다. 이렇게 생성된 샘플들에는 차이가 있을 것이고, 샘플로 학습시킨 최종적인 모형도 차이가 존재할 것이다. 그리고 이러한 차이가 바로 변동성, variance를 의미한다. 다. Bias.. 강의 내용 정리하기/실습으로 배우는 머신러닝 2022. 11. 21. [K-mooc] 2. Machine Learning Pipeline 성신여대 김영훈 교수님의 K-MOOC 실습으로 배우는 머신러닝 강의 내용을 바탕으로 포스팅하였습니다. 1차시: 머신러닝 프로세스 개요 1. 머신러닝 프로세스 개요 가. 머신러닝 과정 나. Data 관련 용어 Dataset: 정의된 구조로 모아져 있는 데이터의 집합 Data point(observation): dataset에 속해 있는 하나의 관측치 Feature(Variable, Attribute): 데이터를 구성하는 하나의 특성 - 숫자형, 범주형, 시간, 텍스트, 이진형 등의 값이 들어가 있을 수 있다. Label(Target, Response): 입력 변수들에 의해 예측, 분류되는 출력 변수, 우리가 맞춰야 할 변수이다. 신용점수 예측 모델에서 feature는 직업, 연봉 등이 될 수 있고 labe.. 강의 내용 정리하기/실습으로 배우는 머신러닝 2022. 11. 21. [K-mooc] 1. Introduction to Machine Learning(머신러닝 개요, 선형회귀) 성신여대 김영훈 교수님의 K-MOOC 실습으로 배우는 머신러닝 강의 내용을 바탕으로 포스팅하였습니다. 1차시: 인공지능과 머신러닝 개요 1. 머신러닝의 발전 머신러닝의 발전에 큰 역할을 한 것은 아래 2가지, 빅데이터와 분산화된 컴퓨팅의 등장이다. 1️⃣ 빅데이터시대의 도래 2️⃣ 분산화된 컴퓨팅의 등장(효율적이고 빠른 계산이 가능한 장비의 등장), GPU computing 기술 💡 CPU computing VS GPU computing CPU는 중앙처리장치로 기본적인 연산과 계산을 해주는 장치이다. 보통은 CPU 컴퓨팅을 이용해 계산을 해왔지만, 최근 GPU 컴퓨팅 기술을 이용하여 굉장히 효율적으로 계산을 할 수 있게 되었다. CPU와 GPU를 활용하여 그림을 그린다고 가정하면, CPU는 그림을 그리기.. 강의 내용 정리하기/실습으로 배우는 머신러닝 2022. 11. 21. [TIL] 20221120(일) 나는 오늘 무엇을 했는가? 1. ML 복습 2. 미니프로젝트 4번째 복습 및 회고/TIL 2022. 11. 21. [TIL] 20221119 (토) 나는 오늘 무엇을 했는가? 1. JD 탐색 2. 미니프로젝트 총공부시간 3시간 44분 54초 복습 및 회고/TIL 2022. 11. 19. [GROUP BY] 30. 년, 월, 성별 별 상품 구매 회원 수 구하기 👉 https://school.programmers.co.kr/learn/courses/30/lessons/131532 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) REST_INFO 테이블에서 2) 음식종류별로 즐겨찾기수가 가장 많은 식당의 3) 음식 종류, ID, 식당 이름, 즐겨찾기수를 조회하는 SQL문을 작성해주세요. 4) 이때 결과는 음식 종류를 기준으로 내림차순 정렬해주세요. 💡 풀이 SELECT YEAR(S.SALES_DATE) AS YEAR , MONTH(S.SALES_DATE) AS MONTH , I.GENDER AS .. 코딩테스트/프로그래머스 SQL 2022. 11. 18. [GROUP BY] 29. 식품분류별 가장 비싼 식품의 정보 조회하기 👉 https://school.programmers.co.kr/learn/courses/30/lessons/59041 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) 동물 보호소에 들어온 동물 이름 중 두 번 이상 쓰인 2) 이름과 해당 이름이 쓰인 횟수를 조회하는 SQL문을 작성해주세요. 3) 이때 결과는 이름이 없는 동물은 집계에서 제외하며, 4) 결과는 이름 순으로 조회해주세요. 💡 풀이 SELECT NAME, COUNT(*) AS COUNT FROM ANIMAL_INS WHERE NOT NAME IS NULL GROUP BY NA.. 코딩테스트/프로그래머스 SQL 2022. 11. 18. [GROUP BY] 28. 고양이와 개는 몇 마리 있을까 👉 https://school.programmers.co.kr/learn/courses/30/lessons/59040 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) 동물 보호소에 들어온 동물 중 고양이와 개가 각각 몇 마리인지 조회하는 SQL문을 작성해주세요. 2) 이때 고양이를 개보다 먼저 조회해주세요. 💡 풀이 SELECT ANIMAL_TYPE, COUNT(*) AS count FROM ANIMAL_INS GROUP BY ANIMAL_TYPE ORDER BY ANIMAL_TYPE 코딩테스트/프로그래머스 SQL 2022. 11. 18. 이전 1 ··· 18 19 20 21 22 23 24 ··· 30 다음