분류 전체보기350 [Mini-Project 2] 최근 11년간 소비자물가지수 데이터 EDA 본 프로젝트는 2022년 10월 13일 ~ 2022년 10월 16일에 진행했던 프로젝트입니다. 1. 데이터 출처 및 설명 [링크] KOSIS kosis에서 제공하는 소비자 물가지수 데이터로 최근 11년간 소비자 물가지수를 전처리한 후 EDA하는 프로젝트를 진행했다. 데이터는 연도 및 월별, 지출목적별, 시도별에 따른 소비자 물가지수가 포함되어 있다. *기간: 2012.01 ~ 2022.09 *지출목적: 총 지수를 포함한 13개 지출목적 '총지수', '식료품 및 비주류음료', '주류 및 담배', '의류 및 신발', '주택, 수도, 전기 및 연료', '가정용품 및 가사 서비스', '보건', '교통', '통신', '오락 및 문화', '교육', '음식 및 숙박', '기타 상품 및 서비스' *지수 기준: 2020.. 프로젝트/AIS 2022. 11. 11. [TIL] 20221111(금) 나는 오늘 무엇을 했는가? 1. 멋쟁이 사자처럼 A스쿨 7기 타블로 강의 2. 프로젝트2 수정 작업 나는 오늘 무엇을 느꼈는가? 타블로를 활용하면 효과적으로 시각화를 할 수 있는 것 같다. 특히 python으로 시각화를 하는 것 보다 훨씬 눈에 잘 들어오고 손이 덜 가는 것 같다. 따라하면 금방 금방 하는 것 같지만 막상 혼자 해보려고 하면 막히는 부분이 있는 것 같다. 배운 내용 복습 잘 해서 내꺼로 만들어보자! 총 공부시간 09시간 48분 09초 - AIS: 8시간 - 그 외: 1시간 48분 09초 복습 및 회고/TIL 2022. 11. 11. [SUM, MAX, MIN] 20. 최솟값 구하기 👉https://school.programmers.co.kr/learn/courses/30/lessons/59038 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) 동물 보호소에 가장 먼저 들어온 동물은 언제 들어왔는지 조회하는 SQL 문을 작성해주세요. 💡 풀이 SELECT MIN(DATETIME) FROM ANIMAL_INS 코딩테스트/프로그래머스 SQL 2022. 11. 10. [SUM, MAX, MIN] 19. 가격이 제일 비싼 식품의 정보 출력하기 👉https://school.programmers.co.kr/learn/courses/30/lessons/131115 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) FOOD_PRODUCT 테이블에서 2) 가격이 제일 비싼 식품의 3) 식품 ID, 식품 이름, 식품 코드, 식품분류, 식품 가격을 조회하는 SQL문을 작성해주세요. 💡 풀이 SELECT PRODUCT_ID, PRODUCT_NAME, PRODUCT_CD, CATEGORY, PRICE FROM FOOD_PRODUCT ORDER BY PRICE DESC LIMIT 1 💡 질문사항.. 코딩테스트/프로그래머스 SQL 2022. 11. 10. [SUM, MAX, MIN] 18. 가장 비싼 상품 구하기 👉https://school.programmers.co.kr/learn/courses/30/lessons/131697 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) PRODUCT 테이블에서 2) 판매 중인 상품 중 가장 높은 판매가를 출력하는 SQL문을 작성해주세요. 3) 이때 컬럼명은 MAX_PRICE로 지정해주세요. 💡 풀이 SELECT PRICE AS MAX_PRICE FROM PRODUCT ORDER BY PRICE DESC LIMIT 1 코딩테스트/프로그래머스 SQL 2022. 11. 10. [SELECT] 17. 서울에 위치한 식당 목록 출력하기 👉https://school.programmers.co.kr/learn/courses/30/lessons/131118 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) REST_INFO와 REST_REVIEW 테이블에서 2) 서울에 위치한 식당들의 3) 식당 ID, 식당 이름, 음식 종류, 즐겨찾기수, 주소, 리뷰 평균 점수를 조회하는 SQL문을 작성해주세요. 4) 이때 리뷰 평균점수는 소수점 세 번째 자리에서 반올림 해주시고 5) 결과는 평균점수를 기준으로 내림차순 정렬해주시고, 6) 평균점수가 같다면 즐겨찾기수를 기준으로 내림차순 정렬.. 코딩테스트/프로그래머스 SQL 2022. 11. 10. [TIL] 20221110(목) 나는 오늘 무엇을 했는가? 1. 멋쟁이 사자처럼 AIS 7기 수업 참여 - 분류 모델 및 머신러닝 알고리즘 정리하기 - 원 핫 인코딩 복습 2. SQL 4문제 풀이 3. plotly 과제풀이 나는 오늘 무엇을 느꼈는가? plotly 오랜만에 하니까 생각이 하나도 안난다... 조만간 plotly를 다시 정리해야겠다. 총 공부시간 11시간 13분 26초 - AIS: 8시간 - 그 외: 3시간 13분 26초 복습 및 회고/TIL 2022. 11. 10. [TIL] 20221109 (수) 나는 오늘 무엇을 배웠는가? 1. AIS 7기 오늘코드 박조은 강사님 수업 [👇수업 내용을 바탕으로 정리한 내용입니다. 😊👇] ----------------------------------------------------------------------------------------------------------------------------- # feature scaling 1. 변수스케일링이란? feature의 범위를 조정하여 정규화하는 것 트리기반 모델은 데이터의 절대적인 크기보다는 상대적인 크기에 영향을 받기 때문에 따로 스케일링을 해줄 필요는 없지만, 다른 모델을 사용할 때는 변수 스케일링을 해주어야 올바른 분석을 할 수 있다. 2. 스케일링이 왜 중요할까? 1️⃣ feature의 범위가 .. 복습 및 회고/TIL 2022. 11. 9. [ML] 16. 데이터 전처리 (5) - 희소값 다루기(기타처리) 1. 희소값이란? 범주형 피쳐에서 빈도가 낮은 값 - 데이터를 수집하다 보면 자연스럽게 비율이 높은 값과 낮은 값이 생겨난다. 2. 왜 희소값을 처리해주어야 할까? - 희소값은 데이터 해석을 왜곡하고 머신러닝 성능을 떨굴 수 있기 때문이다. - 희소값을 적절하게 처리를 해주어야 데이터의 전체적인 경향을 파악하는데 좋다. - 또한, 희소값에 대해 one-hot-encoding을 하게 되면 오버피팅이 발생할 수도 있고 너무 희소한 행렬이 생성되기 때문에 계산에 많은 자원(시간, 용량 등)이 필요하다. 3. 희소값 처리 방법 1) 희소값을 결측치 처리하기 2) 희소값을 "기타" 등으로 묶어주기 => 이후 인코딩 진행해도(pd.get_dummies, OneHotEncoder) 해당 값은 인코딩이 되지 않는다. .. 머신러닝과 딥러닝/ML 개념정리 2022. 11. 9. [ML] 15. 데이터 전처리 (4) - 이상치 다루기(스케일링) 멋쟁이 사자처럼 AI스쿨 7기 오늘코드 박조은 강사님의 수업 자료를 바탕으로 포스팅하였습니다. 1. 이상치란? feature에서 일반적인 값의 분포를 벗어나는 경우 - 데이터 수집과정 또는 조작과정에서 오류가 나서 이상치 발생 - 정말 예외적인 경우가 발생하여 이상치 발생 이상치를 찾는 2가지 방법 1) 값의 범위를 지정하여 범위에서 벗어나는 값 찾기 2) 데이터를 시각화 하여 눈에 띄는 값 찾기 1번 방법은 2번에 비해 전문적이지만 어렵고 2번 방법은 2번에 비해 한 눈에 파악하기 쉽지만 주관적일 수 있다. 2. 왜 이상치를 처리해야 할까? 데이터를 왜곡하여 잘못된 결론을 도출할 수 있기 때문에 적절한 방법으로 처리를 해주어야 한다.(제거, 대체 등) 3. 이상치 탐색 1) 기술통계 값 확인하기 tra.. 머신러닝과 딥러닝/ML 개념정리 2022. 11. 9. [ML] 12. 데이터 전처리(1) - 기본방법 개요 1. 데이터 전처리 방법 데이터 전처리 사진출처: Data Preprocessing Concepts with Python | by Amit Chauhan | Towards AI 1) 정규화(scaling) normalization, 스케일의 차이가 클 경우 정규분포로 만들어주거나 스케일 값을 변경해주는 것 2) 이상치(Outliers) 이상치를 제거하거나 대체 이상치를 어떻게 처리할 것인가를 결정할 때는 상당한 도메인 지식이 필요하다. 이상치 자체가 의미를 가지고 있을 수 있기 때문 3) 대체(imputation) 결측치가 있으면 채워오라고 오류를 뱉어낸다. 이때 결측치를 제거하거나 imputation을 진행하여 대체해야한다. 4) 인코딩(encoding) 머신러닝에서는 문자가 있으면 오류를 뱉어내며 문.. 머신러닝과 딥러닝/ML 개념정리 2022. 11. 9. [SELECT] 16. 오프라인/온라인 판매 데이터 통합하기 👉https://school.programmers.co.kr/learn/courses/30/lessons/131537 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 🤔 문제 분석 1) ONLINE_SALE 테이블과 OFFLINE_SALE 테이블에서 2) 2022년 3월의 오프라인/온라인 상품 판매 데이터의 3) 판매 날짜, 상품ID, 유저ID, 판매량을 출력하는 SQL문을 작성해주세요. 4) OFFLINE_SALE 테이블의 판매 데이터의 USER_ID 값은 NULL 로 표시해주세요. 5) 결과는 판매일을 기준으로 오름차순 정렬해주시고 판매일이 같다면 상품.. 코딩테스트/프로그래머스 SQL 2022. 11. 9. 이전 1 ··· 21 22 23 24 25 26 27 ··· 30 다음